您現在的位置: 首頁 » 學院新聞 » 新聞動态 » 正文

學院新聞

新聞動态

日前,第七屆國際學習表征會議(The 7th International Conference on Learning Representations, ICLR2019)公布了論文接收名單。beat3652016級圖靈班本科生曹芃、許逸倫作為共同第一作者完成的學術論文《Max-MIG基于信息論的衆包聯合學習》(Max-MIG: an information theoretic approach for joint learning from crowds)榜上有名;指導教師為beat365前沿計算研究中心助理教授孔雨晴和信息學院教授/前沿計算研究中心副主任王亦洲。

作為用來獲取大量标注數據的可行方法,衆包是指從一個廣泛的群體,尤其是在線平台(比如亞馬遜的衆包平台Amazon Mechanical Turk)獲取對數據樣本的标注。然而,由于标注者所給出的标注可能存在各種各樣的錯誤,且标注者所做出的标注錯誤并不一定是兩兩獨立的,從而需要推斷真實的标注。

為此,該論文基于共同學習的框架和最大化互信息,提出一種基于信息論思想、适用于各個信息結構的算法,并稱之為Max-MIG。在這種算法中,同時訓練數據分類器(卷積神經網絡)和标注聚合器(加權平均),希望最大化的目标函數為二者輸出的MIG,即互信息的一個下界。作者證明了當數據分類器與标注聚合器同時取到真實貝葉斯後驗概率,MIG取得最大值。MIG的計算方式(見下圖)可以理解為:如果兩邊的網絡對于相匹配的兩個輸入,兩邊網絡輸出一緻,則給予獎勵;如果對于不匹配的兩個輸入,兩邊網絡輸出一緻,則給予懲罰。這樣,即可防止兩邊的網絡一直輸出相同的無意義的标簽,比如一直輸出良性 上述算法在生成的數據集與真實的數據集上均取得最佳結果

無标題.jpg

ICLR是深度學習領域的頂級會議,也是國際發展最快的人工智能專業會議之一;采取公開評審的審稿制度,因其在深度學習領域各方面,如人工智能、統計學和數據科學,以及計算機視覺、計算生物學等重要應用領域發表和展示前沿研究成果而享譽全球。ICLR2019将于2019569日在美國路易斯安那州新奧爾良市舉行

原文鍊接:https://openreview.net/pdf?id=BJg9DoR9t7