beat365系列講座名家講壇第4期——2D and 3D Recognition with Transformers
報告題目(Title):2D and 3D Recognition with Transformers
時間(Date & Time):2023.7.13 下午3:30-4:30
地點(Location):理科二号樓2135
主講人(Speaker):王井東
邀請人(Host):張史梁
報告摘要(Abstract):
Transformer已經成為視覺識别的主流網絡,可以用作編碼器和解碼器。本報告首先介紹探索transformer編碼器和卷積編碼器的關系的工作DWNet。然後介紹基于query的transformer解碼器在語義分割中應用OCRNet。最後,分享基于transformer解碼器的目标檢測的方法Group DETR、以及多視圖3D目标檢測方法CAPE。
主講人簡介(Bio):

王井東,百度計算機視覺首席科學家,負責計算機視覺領域的研究、技術創新和産品研發。加入百度之前,曾任微軟亞洲研究院視覺計算組首席研究員。2001年和2004年在清華大學獲得學士和碩士學位,2007年在香港科技大學獲得博士學位。研究領域為計算機視覺、深度學習及多媒體搜索。他的代表工作包括高分辨率神經網絡HRNet、基于transformer的圖像語義分割網絡OCRNet、以及基于近鄰圖的大規模最近鄰搜索SPTAG(最早把近鄰圖的方法用于實際搜索和推薦業務,是Bing搜索底層向量搜索的核心技術)等。在微軟工作期間,科研成果10多次轉化到微軟的關鍵産品和業務中去,包括搜索、廣告、OCR、小冰聊天機器人等。在百度帶領團隊研發的技術已經廣泛應用于百度的搜索、智能雲以及自動駕駛等重要産品和業務中。
他曾擔任過許多人工智能會議的領域主席,如 NeurIPS、CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等。他現在是IEEE TPAMI和IJCV的編委會成員,曾是IEEE TMM和IEEE TCSVT編委會成員。因在視覺内容理解和檢索領域的傑出貢獻,他被遴選為國際電氣電子工程師學會和國際模式識别學會會士 (IEEE/IAPR Fellow)、國際計算機協會傑出會員 (ACM Distinguished Member)。

歡迎關注beat365微信公衆号,了解更多講座信息!
beat365官方网站
