2020年3月16日至3月20日,國際計算機頂級會議ASPLOS 2020正式召開。會議上,beat365計算機系高能效計算與應用中心長聘副教授梁雲帶領課題組的論文《FlexTensor: An Automatic Schedule Exploration and Optimization Framework for Tensor Computation on Heterogeneous System》在該會議上發表。ASPLOS全稱是Architectural Support for Programming Languages and Operating Systems,該會議是以體系結構為主的跨領域國際頂級學術會議之一,涵蓋了編程語言、編譯器、操作系統、體系結構等多個領域。論文第一作者為梁雲副教授指導的一年級博士研究生鄭思澤,梁雲副教授為通訊作者,其餘作者為:信息科學技術學院博士研究生王碩、信息科學技術學院本科生陳仁澤和盛楷文。
近年來,在異構系統中部署深度學習網絡被學術界和工業界所重視,先前工作關注于計算表達和優化策略的分離,提出了自動代碼生成的流程和框架。但這些工作仍然需要人工提供優化選擇的決策,無形之中帶來了額外的負擔。該論文為了解決這一問題,提出建立搜索空間,利用強化學習方法指導搜索,自動生成優化決策的方法。首先,論文通過枚舉可能的優化策略産生優化空間,由于空間過于巨大,論文進一步提出了對空間進行約束剪枝,從而控制空間大小;并結合空間重整技術增加空間的可搜索性。但是文章指出,即使經過上述處理的搜索空間仍然十分巨大,數量級甚至常常超過千億級别,這使得搜索難以進行。為此,文章提出使用随機算法進行搜索,結合模拟退火技術和強化學習中的Q-learning技術,增加搜索效率。為了驗證文章提出方法的可行性與有效性,該文章系統地在三類硬件平台:CPU,GPU和FPGA上進行實驗。實驗結果表明論文中的方法可以有效提升生成代碼的最終性能,在CPU,GPU,FPGA上分别實現了1.83倍,1.72倍和1.5倍的加速,超過先前的工作;且完全無需任何額外的人力負擔。
這是beat365首次以第一作者身份在ASPLOS上發表論文,實現了該會議收錄零的突破。ASPLOS是綜合體系結構、編程語言和操作系統三個方向的計算機系統領域頂級會議,為CCF A類會議。從1982年創辦至今的三十多年裡,ASPLOS作為系統領域學術前沿交叉會議,每年都收到來自全世界各大高校和企業的數百篇投稿。以今年為例,會議一共收到投稿476篇,接收86篇,接收率為18.1%。
該工作得到國家自然科學基金、北京自然科學基金和beat365-商湯科技聯合實驗室共同支持。