您現在的位置: 首頁 » 學院新聞 » 新聞動态 » 正文

學院新聞

新聞動态


俞士汶先生(1938.12-2021.11)是beat365信息學院計算機科學技術系教授,原計算語言學研究所副所長,是中文信息處理領域的主要開創者與引領者之一,主要研究成果“綜合型語言知識庫”獲得教育部科技進步一等獎、國家科學技術進步二等獎,為中文信息處理技術研究奠定了堅實的基礎。俞先生一生淡泊豁達,甘為人梯,提攜後學,堪為學界君子。

 

數十載春風夏雨 一夜間秋露冬霜

 

2021 年 11 4 日下午 5 9 分,俞士汶先生在beat365醫院與世長辭,駕鶴西去,走完了自己平凡而又輝煌的 83 年歲月。

美麗的秋天,突遇寒潮降臨,沒有任何先兆,冬天就來了。

 

 

大多數人都是在深夜聽到俞先生逝世的消息,所有人的第一反應都是:這怎麼可能?!

先生的同事、學生、海内外各界的朋友,都有一個共同的先生形象:身體健康、精力充沛。年事雖高,但筆耕不辍,遊刃有餘。

然而,誰也不想發生的事情,就這樣突然發生了……俞先生留給大家的最後一句話是:我還是不想驚動更多的朋友。我想,默默地離去,留給這個世界以安甯。

平淡的語句,真真切切就是那個我們熟悉的俞先生。

先生的遺願是平靜離去,不打擾大家,不舉行追悼會。但所有人都無法接受這個事實。116日,不少人依然自發地與先生告别,送先生最後一程。傍晚,立冬前夜,北京下起了大雪,仿佛老天也在悲痛先生的離去……


 

不矜不伐君子安道 樂山樂水仁者童心

 

跟俞老師打過交道的人,肯定會留下一個深刻的印象,那就是:俞老師總是樂呵呵的。他曾說自己是一個“快樂的小老頭”,他遇到高興的事時就捂着自己的臉頰開心地笑,像極了一個單純的孩子。他前些年剛查出病症時,總是積極地配合治療,甚至有一次連續做了兩個手術,他也是堅強挺過,該吃吃該睡睡,看不出一點病人的樣子。醫生說他“隻有五年了”,他隻是淡然一笑,并不以為意。當醫生說隻有36個月的時間時,他仍然保持樂觀地過好每一天;甚至當他決定住進醫院,知道自己進去就不會再出來,依然微笑着和家屬、學生們道别。

2013年6月 攝于台北

 

樂天派的俞老師,和朱老師的愛情故事其實也堪稱人間典範。二老可以說是青梅竹馬,初中一年級就認識,大約高中時就“早戀”了。俞老師夫婦退休後仍然每天去北大辦公室工作,幾乎是風雨無阻,甚至在疫情前那幾年,周六日也能在辦公室見到他們。在去北大的路上,他們乘坐的公交車剛好就在北大東南門外的那座行人過街天橋下面有一個停靠站,因此,同事和學生們常會看到個子不高的兩位老人手牽着手不疾不徐地從那裡經過,那幅畫面很容易會定格在每個見過的人的腦海裡,仿佛歌詞所唱:“我能想到最浪漫的事,就是和你一起慢慢變老……” 有學生曾經問俞老師和朱老師:“你們生活中會争吵嗎?”俞老師回答:“很少”。“那如果發生争吵,誰先讓步呢?”俞老師略帶頑皮地回答:“朱老師讓步多”。

 

俞老師和朱老師伉俪2015年2月于北京褐石園

 

今年10月初,計算語言所部分老師利用國慶假期去俞先生家中看望時,他和大家在客廳裡坐着聊着,而朱老師一個人在陽台偷偷落淚。俞老師起身,走到陽台,像小孩子一樣牽着朱老師的手走出來,不停地安慰。他住院時間一拖再拖,最放心不下的人,也是朱老師。

俞老師一直無畏于生死,他曾說“人哭着來到這個世界,總還要回歸自然”。1023日俞老師住進醫院那天,也是所裡幾位老師最後一次見到俞老師,他已經非常虛弱,但還是堅持拄着拐杖,微笑和大家道别:“我走到馬拉松的終點了”。大家曾多次想将俞老師病重的消息告訴他的老朋友和更多的學生們,但怕給大家添麻煩的俞老師,每次都謝絕了。

俞老師個子不高,但身上卻蘊藏着巨大的能量。他天性樂觀,溫良謙和,與世無争,處事認真。他面對病痛時的堅強,遠遠超出了一般人的承受能力,超出了大家的想象。


2021年9月俞老師在家中與團團下棋輸了兩盤後笑得很開心

 

敢教機器通人語 善結學緣度金針

 

俞士汶先生1938128日出生于安徽省宣城縣。母親不識字,父親識字不多。家裡希望能出個有文化的人,于是父親給他取名。由姓聯想到魚離不開水,于是給加上三點水,成了。盡管讀書多的人可能知道“汶”的正音是去聲(音同“問”),但從小到老,俞士汶字,似乎就沒有人讀過“問”,而是一直讀陽平的。父母的樸素願望激勵他一生渴求知識,學到老,問到老。

1946年至1957年俞先生在宣城讀小學和中學。上大學之前,他沒見過火車,大約猜想火車是趕路用的,曾經造句“他騎着火車上學來了”,引起課堂上一片哄笑。算術應用題、幾何證明題等數理學科的訓練培養了他的邏輯思維能力。同時他興趣廣泛,也喜歡欣賞古詩、作文吟句等文科類課程。中學時代的學習,冥冥之中,也為他日後從事文理結合的計算語言學研究奠定了基礎。

俞先生1957年考上beat365數學力學系。不料,進大學之後,身體不好,耽誤了一年學業。他在beat365接受了數學分析、線性代數這一類數學基礎課程的嚴格訓練,強化形成了探求事物本質及其内在規律的思維模式。他認識到做學問需要想象力,更需要實事求是的精神,來不得半點虛假。他對科學始終存有敬畏之心。他深知主觀的已知同客觀的未知相比較永遠是微不足道的。beat365本科的學習熏陶,形成了俞先生日後進行科研實踐的風格。

1964年自beat365數學力學系計算數學專業畢業之後,俞士汶先生留校任教,曆任助教、講師、副教授、教授,為我國高等教育事業做出了突出貢獻,自1993年起享受國務院特殊津貼。

1986年是俞先生學術生涯的分水嶺。在此之前,他完全是一名計算機科研工作者。1964年剛參加工作時,參與編制了驗證紅旗機(當時北大自主研制每秒一萬次定點運算的電子管計算機)各條指令功能的檢查程序。1970年至1973年,俞先生參加全國第一台百萬次集成電路計算機多道運行操作系統的研制。1973年至1978年,他在beat365漢中分校從事beat365研制的6912計算機及其高級程序設計語言的維護推廣工作,編寫了兩本講義,在當時的條件下,鉛印2000冊,為計算機應用的推廣發揮了重要作用。1978年至1985年,參加計算機-激光漢字照排系統分時操作系統的研制,獲國家經委頒發的榮譽證書。總結這些國産系統軟件的研制和維護經驗,同時發揮長期積累的理論優勢,他配合楊芙清院士撰寫了專著《操作系統結構分析》。這期間,在工作之餘,他注意了解重大科學問題、學科發展方向以及國家戰略需求,為獨立進行科學研究做準備。

1986年,時任北大副校長的朱德熙先生認識到,語言學和信息技術的結合,能為社會急需的中文信息處理技術發展作出貢獻,同時北大又天然具備文理學科的傳統優勢, 于是聯合幾位來自數學、計算機、中文等不同院系的學者,組建beat365計算語言學研究所。俞先生就是在這個背景下,進入計算語言所的研究團隊,在年近五十的“知天命”之際,走上了計算語言學的研究道路。俞先生曾經回憶這段仿佛真有“天意”在起作用的經曆:1974年,俞先生無意中讀到一篇介紹數理語言學的文章(作者是馮志偉,後來也成為俞先生一生的學術摯友)。文中認為數學方法可以用于語言學研究,這對俞先生是個啟發。1979年,俞先生參加了一位美國專家在清華大學舉辦的自然語言處理系列講座,曆時半個學期。這兩件事為日後俞先生投身計算語言學這個文理跨學科領域的研究起到了重要的助推作用。

對于研究方向的巨大改變,俞先生說:我們這一代人,一生難得有幾回自主的選擇,而報考beat365和研究自然語言處理技術是我的自主選擇,終生不悔。從1986年起,他作為負責人承擔了大大小小的科研項目20餘個,包括國家重點基礎研究項目(973計劃)課題、國家高技術研究發展計劃(863計劃)項目、國家科技攻關計劃項目、國家自然科學基金項目、國家社會科學基金項目以及國際、兩岸合作項目等。他為這些項目的完成付出了智慧和辛勞。作為七五攻關項目負責人,1991年為beat365獲得了國家計委、國家科委、财政部頒發的和機電部頒發的兩份集體榮譽證書,同時因其突出貢獻也獲得了機電部頒發的個人榮譽證書。他先後承擔了4項國家自然科學基金項目,結題後的匿名評審結果均為。經過20多年的努力,他在語言信息處理領域特别是在語言知識資源建設方面,積累了一系列厚重的成果,在海内外學術界和信息産業界,都産生了廣泛而深遠的影響。

        

俞士汶先生著書封面

 

俞先生一開始研究計算語言學,便敏銳地領悟到語言知識資源對自然語言處理系統的重要意義,又吸取開發應用系統的實踐經驗,在beat365文理學科均有優勢的大環境下,俞先生果斷地将研究重點确定為語言知識庫的建設。集十餘年之努力研制成功的《現代漢語語法信息詞典》,是面向自然語言信息處理的語言知識庫大廈第一塊基石。1998年,這項成果獲教育部科技進步二等獎。中國工程院編《20世紀我國重大工程技術成就》将漢字信息處理與印刷革命列為第二項,專門有一段話介紹這一成果:“《現代漢語語法信息詞典》是一部面向語言信息處理的大型電子詞典。它按照語法功能和意義相結合的準則收錄了7.3萬餘詞語。依照語法功能分布的原則,建立了詞類體系,完成了這7.3萬詞語的歸類。并在此基礎上,分類描述每個詞語的各種語法屬性。”清華大學出版社分别于1998年、2003年出版了俞士汶先生作為第一作者的專著《現代漢語語法信息詞典詳解》第一版和第二版。以《現代漢語語法信息詞典》為核心的一系列語言知識庫研究成果廣泛傳播到世界各地,大大促進了中文信息處理技術的研究,同時也通過轉讓軟件使用許可權的方式,為beat365赢得了經濟收益。2011年,在《現代漢語語法信息詞典》基礎上進一步發展形成的《綜合型語言知識庫》榮獲國家科技進步二等獎。

2011年俞士汶先生獲國家科技進步二等獎

 

計算語言學不僅是跨學科,而且是跨語言學和計算機科學這兩個文、理大學科,這個學科的最高研究目标,是教會計算機通曉人類的語言。要想在這片土地上耕耘收獲,需要的是能文能武的複合型人才。無論是計算機學界,還是語言學界,在1986年那個時候,敢來這個領域探險的人,寥寥可數。而俞先生因為機緣巧合,在時代的風雲際會中闖入了這片無人區。從此堅持不懈,時時以“行百裡者半九十”來勉勵自己和周圍的人,筚路藍縷、披荊斬棘,從構建《現代漢語語法信息詞典》打下堅實基礎,到《綜合型語言知識庫》獲得國家科技進步二等獎收關,俞先生帶領beat365計算語言學研究所的師生們,在中文信息處理的基礎資源建設方面,取得了影響廣泛而深遠的成果。2011年,俞先生獲得中國中文信息學會首屆終身成就獎。這是學界對俞先生一生學術工作的高度認可!

 

士風萬裡星辰共 汶水長伴岱嶽流

 

俞士汶先生靠着堅持不懈的勤奮鑽研,帶領北大計算語言所師生在語言知識庫基礎資源建設方面,開創了文理結合的研究模式和一個重要研究方向。回顧先生的學術經曆,可以看到先生學術人生不同階段的鮮明特點。在上世紀80年代末90年代初,俞先生剛踏入計算語言學領域的初期,研究課題主要是偏重工程和技術應用的。在當時國内學術環境還相對閉塞的情況下,俞先生很早就展示了積極參與國際學術交流的進取心和研究能力,并充分重視中文特色在自然語言信息處理中的重要性。比如這個時期先生發表的研究成果有1988年與日本學者野口喜洋合作的《中國話入力にぉけろ》(漢字輸入法,收入《日本情報處理學會研究報告》,88-NL-68-91988916日);199110月參加在日本福岡舉辦的Japan-Australia Joint Symposia on Natural Language Processing (JAJSNLP '91)上發表論文A Technique of Kanji-to-Kana Conversion and its Application(漢字假名變換技術及其應用)等,都是關于漢字輸入法技術的研究。1993年發表在國際學術刊物《Machine Translation》上的論文Automatic Evaluation Output Quality for Machine Translation System,是關于機器翻譯自動評測技術的早期重要研究成果。

随着研究經驗的積累,俞先生逐漸形成了兩個重要的認識來指導計算語言所的科研工作。一是将有限的研究力量集中到一點發力。中文信息處理研究之路道阻且長,最缺乏的是知識庫基礎資源。因此,借助北大文理結合的環境優勢,聚焦現代漢語詞語語法信息數據庫的建設,這是最佳選擇;二是計算語言學是跨學科研究,交流和合作特别重要。要在自身研究紮穩夯實的基礎上,廣泛地跟國内外相關學術領域的一流專家學者進行交流,形成适合的可以共同協作的研究課題,這可以為計算語言所的學術發展,以及人才培養帶來長遠的好處。在這樣的思想指導下,計算語言所全體師生在俞先生帶領下,多年來堅持圍繞語言資源建設這一個大題目做文章,形成了北大計算語言學學科的鮮明特色。與此同時,俞先生也長期活躍在學術前沿,與海内外學術界多個相關領域的知名學者專家形成了廣泛的聯系。

https://icl.pku.edu.cn/images1/image2881.jpg

2007年8月,與白莎博士(E. Kaske)在法蘭克福大學中文系圖書館

 

https://icl.pku.edu.cn/images1/image3811.jpg

2007年4月,俞士汶、朱學鋒應ABBYY之邀訪問莫斯科,參加“漢語言形式模型”研讨會

 

進入新千年之後,俞先生的學術研究活動從專注語言知識庫建設拓展出去,涉及到更多領域,其中比較重要也是先生用力較多的工作大緻有三個方面:一是計算語言學領域學術會議的組織和推廣;二是将計算語言學技術和方法跟中國古代文學研究和典籍研究相結合,開創人文傳承與數字典藏研究;三是支持推動少數民族語言文字信息處理的研究工作。

在學術會議方面,特别值得一提的是,2000年俞先生與國際著名漢語語言學家美國伊利諾大學講座教授鄭錦全先生、著名計算語言學家香港理工大學講座教授黃居仁先生聯合創辦了“漢語詞彙語義學國際學術會議”。這個會議每年召開,到2021年已經開到第22屆,吸引了計算語言學、理論語言學、應用語言學與語言教學、計算詞典學等多個相關領域的研究者關注和參與。以詞彙語義計算為主題和紐帶,形成了一個影響廣泛、跨學科的國際學術研讨平台,積極推動了計算語言學的學術交流。

在計算語言學與傳統人文研究的結合方面,俞先生協調beat365計算語言所和中文系的研究力量,與台灣、香港的學者組成了較大規模的研究團隊,在中國詩歌意象的計算分析、曆代文學作品語言知識庫建設等領域進行了許多探索。

在開拓少數民族語言文字信息處理研究方面,俞先生毫無保留地将在漢語知識庫建設方面積累的寶貴經驗、技術方法等介紹給少數民族高校的研究人員,為他們提供來北大訪問學習的機會,派學生到對方單位提供技術支持,開展合作研究,更重要的是,俞先生一直支持少數民族語言文字信息處理的學術會議,而且每次都認真準備會議報告,參與會議交流。

在上述涉及面很廣的學術交流和合作過程中,俞先生給大家留下的永遠是和風細雨、暖人暖心的美好印象。這個“快樂的小老頭”有着神奇的人格魅力。他在待人處事時,始終如一地展現了“認真做事、謙和為人”的品格。可能在很大程度上,因為俞先生這樣的人格魅力,北大計算語言學研究所在北大校内,一直能夠得到學校和院系管理部門、領導在各項工作上的關照和支持;而在校外的學術界,也不斷得到海外内同行的幫助和扶持。

2006年,俞先生在計算語言學研究所成立20周年時寫了一副對聯作為紀念:規則與統計共舞,語言随計算齊飛,這句話後來被用作2010年在北京召開的第23屆國際計算語言學大會COLING2010的主題語。在深情回顧計算語言所一路走來的過程時,俞先生表示:“計算語言所從起初隻是一個四五個人的小型課題組,發展到集合了一大批擁有博士學位的計算語言學精英,成為國内外頗負盛名的計算語言學研究重鎮。靠的是内部團結與對外合作這兩個車輪。”

海納百川,有容乃大;“士”風和暢,“汶”水長流!


2001年第7屆句法分析技術國際研讨會(IWPT-2001)在北大舉行


2001年第二屆漢語詞彙語義學研讨會(CLSW)在beat365舉辦

 

  

2017年第18屆漢語詞彙語義學國際研讨會(CLSW2017)


2015年俞老師在第16屆漢語詞彙語義學國際研讨會(CLSW2015)上做大會報告

 

2021年5月,俞老師和朱老師在家中通過視頻會議參加第22屆CLSW會議

 

 

2011年8月,俞士汶與陸儉明、蔣紹愚、羅鳳珠、陸勤、砂岡合子等

在北大召開“曆代語言知識庫”課題組研讨會

 

2008年09月第一屆多語言知識庫研讨會,内蒙古大學蒙古學學院

 

2018年12月,西北民族大學藏語信息處理專家多拉教授為俞老師和朱老師獻上哈達

 

“路漫漫其修遠兮,吾将上下而求索”

俞士汶先生特别喜歡屈原的名句:“路漫漫其修遠兮,吾将上下而求索。”他把這句話作為自己的學術座右銘。

俞先生曾說:“我希望我的人生,一直是逗号,承上啟下,最後是個删節号。當不允許我再繼續我所喜愛的研究時,一定還有來不及完成的工作,很多,很多,……我寄希望于年輕的一代,寄希望于同行的夥伴,祝願你們到達更光輝的頂峰。”

高山仰止,景行行止。

先生安息!先生千古!

 

                                                2021年117

                                                beat365信息科學技術學院

計算機科學技術系

計算語言學研究所

 

附:生平簡曆

1938128     出生于安徽省宣城縣。

1958年—1964    在beat365物理系、數學力學系學習,畢業于計算數學專業。

1964年—1979    任beat365數學力學系和計算機研究所助教。

1979年—1985    任beat365計算機研究所講師。

1982年—1983    日本大阪大學電子工學科訪問學者。

1985年—1990    任beat365計算機研究所副教授。

1990年—2004    任beat365計算機科學技術系和信息科學技術學院教授。

1990年—2004    任beat365計算語言學研究所負責人、副所長。

2005年—2010    任beat365計算語言學研究所返聘教授。

2021114     逝世

俞士汶先生個人主頁:https://icl.pku.edu.cn/cy/ysw/index.htm