您現在的位置: 首頁 » 學院新聞 » 新聞動态 » 正文

學院新聞

新聞動态

beat365多篇論文入選系統領域頂級會議USENIX ATC 2024

 

USENIX ATC全稱為USENIX年度技術大會(USENIX Annul Technical Conference),是計算機系統方向最重要的國際會議之一,在國際上享有極高的學術聲譽,也是CCF推薦的A類會議。自1992年以來,已成功舉辦30多屆,吸引了來自全球的頂級名校、科研機構和企業投稿。本屆會議共收到488篇論文投稿,錄用77篇,錄用率僅為15.8%,為近年最低錄用率。

beat365此次被USENIX ATC錄用的4篇論文,研究成果涵蓋多個領域。以下是論文簡要内容介紹:

 

一、面向虛拟化場景的大頁熱膨脹解決框架

大頁被廣泛用于虛拟化環境以提升兩級地址翻譯效率。然而,激進地使用大頁會導緻頁面熱膨脹的問題,即對于一個傾斜訪問部分小頁區域的大頁,hypervisor會錯誤地将其識别為一個高熱度的大頁。在非虛拟化環境下的分層内存管理場景已經有方案解決熱膨脹問題,但是需要在準确性、性能和硬件修改三個方面進行權衡。事實上,在虛拟化環境中,熱膨脹會對更多的應用場景産生性能和資源利用率的影響。針對此挑戰,論文“Taming Hot Bloat Under Virtualization with HugeScope”提出了首個針對于虛拟化環境解決熱膨脹的框架HugeScope。論文的核心思想是利用虛拟化帶來的第二級地址空間穩定的特性,使得EPT極少被修改,并且總是通過穩定的軟件接口進行訪問。HugeScope通過1)利用不一緻地拆分EPT頁表頁完成低開銷、高準确率的小頁粒度監控機制并在EPT的訪問接口添加代碼鈎子保證安全,進而獲得大頁面中小頁粒度的訪問情況; 2)根據頁面的frequencyrecencyskewness抽象出系統的熱頁膨脹率,全面且動态地決策和調整頁面的大小;3)提供一套模塊化接口以支持不同的管理子系統。與現有的機制相比,HugeScope能夠在分層内存場景帶來61%的性能提升,在頁面共享場景帶來41%内存資源共享提升。該論文第一作者為beat3652021級博士生李傳東(導師為汪小林、羅英偉教授),作者包括華為公司沙賽博士、beat365曾洋卿同學、楊翕然同學、羅英偉教授、汪小林教授、密歇根理工大學王振林教授、EPFL/beat365周迪宇助理教授。

 

二、軟硬件協同處理的用戶态頁面緩存

存儲軟件棧通常會集成頁面緩存(Page Cache)管理模塊,該模塊将熱數據緩存在主存中來加速應用的I/O訪問。然而,現有的頁面緩存管理模塊均根據以主機為中心的原則而設計,這種設計原則使得頁面緩存管理模塊存在CPU開銷、通信開銷和SSD垃圾回收幹擾等問題。為了解決這些挑戰,論文“ScalaCache: Scalable User-Space Page Cache Management with Software-Hardware Coordination”提出了一種軟硬件協同處理的用戶态頁面緩存模塊ScalaCache。具體來說,為了減少主機CPU資源的開銷,ScalaCache将緩存管理卸載到計算型固态硬盤(Computational SSD, CSD)中,并進一步合并緩存管理模塊中的索引結構和CSD固件中的閃存轉換層,從而實現輕量的緩存管理。為了進一步提高性能可擴展性,ScalaCache設計了一個無鎖資源管理框架,允許多個 CSD core并發管理緩存。此外,ScalaCache聚合多個CSD的計算能力來實現基于CSD數量的性能可拓展性。ScalaCache還通過簡化I/O控制路徑來降低通信開銷,同時設計SSD垃圾回收可感知的替換策略來減輕垃圾回收引起的幹擾。與Linux内核頁面緩存和最先進的用戶态緩存管理模塊相比,ScalaCache分别提升了3.38倍和1.70倍的帶寬。該論文第一作者為beat3652023級博士生彭力,導師及通訊作者為張傑助理教授,合作作者包括華中科技大學周遊副研究員、中科院計算所王晨曦副研究員、廈門大學李喬副教授與華為程傳甯博士。

 

三、基于軟硬協同設計的用戶态全閃存陣列引擎

相較磁盤,閃存因其高性能的特點近年來被廣泛應用到數據中心,高性能計算和移動設備中。但單個的閃存已無法滿足日益增長的對可靠性,大容量和高吞吐的要求。使用多個閃存搭建全閃存陣列,利用條帶化技術提高帶寬,同時使用校驗和提供容錯是解決這個問題的可行解。但是,現有的閃存陣列框架存在較大的軟件開銷,這成為了限制全閃存陣列性能和可擴展性的關鍵因素。論文“ScalaAFA: Constructing User-Space All-Flash Array Engine with Holistic Designs”提出使用軟硬協同設計的方式來解決這一問題。一方面,将全閃存陣列引擎整合到用戶态中,同時設計無鎖的線程間同步方案以減少存儲軟件棧開銷。另一方面将校驗生成的任務去中心化,并卸載到閃存中,利用閃存自帶的計算資源進行計算。同時,ScalaAFA設計了一個創新性的數據布局方案,巧妙地規避了校驗生成中數據移動的開銷。ScalaAFA還利用閃存的架構優勢解決了全閃存陣列的元數據持久化和寫放大問題。該論文的第一作者為beat3652022級博士生易舒舒,其導師及論文通訊作者為張傑助理教授,作者還包括beat365潘修睿同學、廈門大學李喬副教授、毛波教授,中科院王晨曦副研究員,阿裡巴巴李強博士以及KAISTMyoungsoo Jung副教授。

 

四、高效的去中心化聯邦奇異值分解

A diagram of a multiplying matrixDescription automatically generated

聯邦奇異值分解(SVD)是許多分布式應用的基礎。例如分解多方持有的大規模基因數據進行全基因組關聯性分析(GWAS),分解銀行和互聯網公司持有的大規模用戶畫像進行特征降維(PCA)和線性回歸建模(LR),分解多方持有的大規模文檔數據進行潛在語義分析(LSA)等。但現有聯邦SVD方案要麼依賴外部服務器,帶來極大的安全隐患;要麼使用同态加密技術來擺脫外部服務器(即去中心化),但由于大量計算和通信開銷而導緻效率顯著下降。本文提出Excalibur,一個高效、去中心化的聯邦SVD系統。Excalibur的核心設計包含兩部分。首先,Excalibur提出了一種輕量級、去中心化的矩陣保護方法,以減少由加密操作帶來的性能下降。此外,通過對去中心化SVD系統的設計空間進行通信定量分析,設計了一個通信高效的去中心化SVD工作流,大幅度優化了通信性能。為了驗證Excalibur的效率,我們實現了一個功能完備的原型系統,并對基于SVD的實際應用進行了廣泛測試。結果顯示,Excalibur不僅移除了外部服務器,而且在不同形狀的十億級矩陣數據上,性能比當前最先進的服務器輔助SVD系統快36倍。此外,Excalibur吞吐量比最先進的同态加密SVD系統大23,000多倍。該論文第一作者為香港科技大學博士生柴迪,作者包括香港科技大學陳凱教授和楊強教授、beat365官方网站王樂業助理教授等。