您現在的位置: 首頁 » 學院新聞 » 新聞動态 » 正文

學院新聞

新聞動态

2019年5月17日下午,在美國舊金山舉行的第28屆國際萬維網大會會議(World Wide Web,簡稱WWW)上,beat365信息科學技術學院計算機科學技術系、高可信軟件技術教育部重點實驗室劉譞哲副教授課題組的論文“基于互聯網普适語言“繪文字”的跨語言情感分析表征學習方法 (Emoji-Powered Representation Learning for Cross-Lingual Sentiment Classification)”獲得了最佳論文獎。

WWW大會是計算機和互聯網領域曆史最為悠久同時也最為權威的頂級學術會議之一,被中國計算機學會列為A類推薦學術會議。本次會議共有1600餘篇論文投稿,隻評選出2篇最佳論文。課題組獲獎論文獲得了審稿專家一緻“強烈推薦錄用”(Strong Accept)意見并最終脫穎而出。據悉,這是WWW曆史上中國學術研究機構(含港澳台)首次獲此榮譽。2019年,也正值萬維網誕生三十周年,獲得本次最佳論文獎具有特别的紀念意義。

在動态、開放和多變互聯網環境下,軟件系統需要深入準确地感知和理解用戶情境(包括所處環境的狀态和用戶的行為),來更加智能地提供服務。作為用戶情境感知和理解中一個重要方面,情感分析得到了包括數據挖掘、系統軟件、人機交互等多個領域研究者的廣泛關注,成為交叉研究的熱點,并取得了一些進展。但現有工作難以解決文本數據在源語言層次上的标注不平衡問題,即大多面向有标注數據的英語文本開展,難以應用于在其他缺乏語義标注的語言文本上,盡管機器翻譯技術的進步可以幫助跨語言的情感分析,但仍然難以捕捉原語言特定的特征。不同于已有任何方法,獲獎論文從互聯網用戶最為廣泛使用的交互方式—繪文字(emoji)入手,提出了一種基于emoji的增強表示學習方法,将從公開英語語料數據中學習到的情感知識遷移到其他缺乏标注語料的語言文本上,效果較現有方法有顯著提升,為互聯網上持有不同語言的用戶之間搭建了一座“情感橋梁”。

2016年開始,劉譞哲副教授課題組在研究移動互聯網系統與服務時發現,emoji正在成為一種新的“普适”語言,是用戶最為廣泛使用的交互方式(大多數輸入法都已内置emoji)。課題組認為,emoji不僅可以讓表達更加生動,而且可以作為一種新的“軟”傳感器(Soft Sensor)來感知和理解用戶的情境。特别地,随着用戶數據的安全隐私問題日益得到關注,如歐盟《通用數據保護條例》(GDPR)等法律法規的推出,傳統方法可能因涉及用戶隐私數據而無法應用;而emoji可以在一定程度上避免涉及這些敏感數據,并在用戶畫像、情感理解等方面被驗證具有良好的效果。以emoji作為理解和分析用戶情境的切入點,課題組在過去三年形成了一系列研究成果,已陸續發表于WWW和UbiComp等國際頂級會議,為用戶情境分析理解并進行服務推薦開辟了全新的研究視角。

本文第一作者為beat365信息科學技術學院2018級博士生陳震鵬,通訊作者為劉譞哲副教授,論文作者還包括beat365信息科學技術學院2014級本科生沈晟、胡子牛,2016級博士生陸璇,以及密歇根大學梅俏竹教授。

近五年來,劉譞哲副教授課題組在WWW大會發表共計8篇長文,其中2019年有3篇長文獲得錄用,表明beat365在計算機與互聯網領域的研究水平持續處于國際前沿。

背景鍊接:WWW大會由萬維網發明人、2016年度圖靈獎獲得者Tim Berners-Lee爵士等人于1992年發起并創辦,是計算機與互聯網領域的頂級學術會議,也被列為《中國計算機學會推薦國際學術會議和期刊目錄》中的A類學術會議,錄用率常年維持在14%17%2019WWW大會于513日-17日在美國舊金山召開。

獲獎證書.jpg