在ACM SIGCOMM 2024上,beat365官方网站共有5篇高水平論文入選。作為計算機網絡系統領域曆史最為悠久也最為權威的學術會議,SIGCOMM以其嚴苛的标準著稱,對論文的質量要求極高,要求所錄用的論文具有基礎性貢獻、領導性影響和堅實系統背景。本年度ACM SIGCOMM共有366篇投稿,錄用62篇, 錄取率不到17%,為近五年最低錄取率。
beat365此次被SIGCOMM錄用的5篇論文,研究成果涵蓋多個領域,包括高效網絡流量驗證、全覆蓋監測框架、可擴展Sketch部署框架、網絡配置匿名技術、和新型數據中心傳輸協議等。以下是論文簡要内容介紹:
一、面向大規模生産環境核心網與任意故障場景的流量負載屬性驗證系統

為全球用戶提供高速穩定的互聯網服務需要連接全球數據中心的大規模核心網,驗證流量負載在任意k點故障下仍符合預期(如不超過鍊路帶寬的80%)是提高網絡容錯能力、避免不可預測的随機故障場景下服務中斷或服務質量下降的有效手段。然而,過去的工作或無法支持在生産環境下使用的複雜網絡協議、或僅能夠低效地逐個枚舉具體的故障場景進行耗時的檢查。論文“A General and Efficient Approach to Verifying Traffic Load Properties under Arbitrary 𝑘 Failures”首次同時解決了這兩個問題。論文提出了通用且高效的流量負載屬性驗證方法YU:受符号執行的思想的啟發,YU首先對任意故障場景下的各類轉發協議進行了建模,以此解決通用性的挑戰;以多端二元決策圖(MTBDD)為基礎,YU進一步在驗證過程中動态識别k故障等價性與鍊路局部等價性,并依照等價性化簡流量負載的計算表達式,以此解決了高效性挑戰。實驗評估表明YU相比與此前工作在同等條件下性能提升可達2042倍。YU在阿裡雲含近千台設備的核心網中得到了部署,部署效果表明其能夠在28.6分鐘内完成任意2點故障的流量屬性驗證,驗證結果揭露了網絡中隐藏的多個潛在隐患。該論文第一作者為beat3652022級博士生李睿涵(導師為許辰人副教授),作者包括許辰人,阿裡雲袁驿飛、葉方丹、劉孟啟、楊睿震、蔡德忠和翟恩南等。
二、面向複雜數據中心網絡的可擴展的全覆蓋監測框架

物理層的監測全覆蓋對于保障數據中心的服務可用性至關重要。然而,由于數據中心底層網絡中的流量技術日趨複雜,精确統計覆蓋率指标都變得富有挑戰性,遑論達到全覆蓋的監測要求。事實上,覆蓋率空洞在生産環境集群裡廣泛存在,并成為業務漏告警的一個核心原因。針對此挑戰,論文 “RD-Probe: Scalable Monitoring With Sufficient Coverage In Complex Datacenter Networks” 提出了全新的監測框架 RD-Probe,并顯式提供了全覆蓋和可擴展性的保證。RD-Probe首先利用設備層的配置信息,将底層技術引入的虛拟化和随機化行為編碼進拓撲圖。然後,其利用拓撲圖,并綜合随機性與确定性的撥測技術,通過二階段方案快速達到任意預先指定的覆蓋率要求,同時平衡關鍵資源的開銷。RD-Probe已經部署在華為雲的三個分别包含千台交換機的集群中,将估計覆蓋率從此前的80.6%提升至99.6%,并且輔助檢測到諸多此前被忽略的網絡側問題。 此外,我們進行了更大規模集群的仿真,并對比了其他三種業界部署的典型監測方案。RD-Probe是唯一一個在複雜流量技術場景下同時實現全覆蓋和可擴展性的監測方案。該論文第一作者為beat3652022級博士生丁睿(導師為黃群助理教授),作者包括beat365黃群、劉勳鵬、楊仕博,華為雲謝寶樹、孫蓉桦、張智和崔伯龍。
三、可拓展且近似最優的Sketch網絡測量算子部署

Sketch具備低資源開銷和理論上的精度保證,因此是一類至關重要的網絡測量算子。然而,在全網範圍内部署Sketch卻需要在部署最優性和可擴展性之間進行權衡:(1)大多數解決方案依賴混合整數線性規劃(MILP)求解器獲取最優部署決策,但它們耗時較長,難以擴展到大規模部署場景。(2)其它解決方案利用啟發式算法提升了可擴展性,但引入了較高的網絡資源和性能開銷。論文“Eagle: Toward Scalable and Near-Optimal Network-Wide Sketch Deployment in Network Measurement”提出了一種可擴展且近似最優的全網Sketch部署框架。核心思想是将全網Sketch部署分解為多個子問題,從而(1)同時優化交換機資源開銷和數據報處理的端到端性能,從而保證全網Sketch部署的近似最優性,且(2)将一系列用于加速問題求解的技術納入子問題求解中,從而保證全網Sketch部署的可擴展性。與現有解決方案相比,Eagle在複雜網絡拓撲環境下将Sketch部署加速了255倍,同時最小化Sketch部署的最優性損失。該論文第一作者為浙江大學beat365博士生陳翔(beat365官方网站訪問學生),作者包括beat365官方网站黃群助理教授、浙江大學beat365吳春明教授和任奎教授等。
四、網絡配置共享中的隐私匿名化保護

現實世界中的真實網絡配置在網絡管理和科研中起着至關重要的作用。然而,由于商業和隐私方面的考慮,數據持有者通常不願共享這些配置。現有的解決方案無法隐藏可從配置中隐式推斷出的敏感信息,例如拓撲結構和路由路徑。論文“ConfMask: Enabling Privacy-Preserving Configuration Sharing via Anonymization”提出了系統化地對網絡拓撲和路由路徑進行匿名化的新型框架ConfMask。我們根據網絡配置推斷出敏感數據拓撲圖和路由表,通過圖匿名化算法和常用路由協議對配置文件進行修改。ConfMask匿名化算法可擴展到大型網絡,并有效地降低了算法被反向去匿名化的風險。此外,ConfMask維持了原有的網絡屬性,如可達性、路由點和多路徑一緻性,使其适用于廣泛的下遊任務。與現有的數據面匿名化算法NetHide相比,ConfMask可減少約75%匿名化前後的網絡之間網絡配置規則的差異。該論文第一作者為beat3652024級博士生王玥潔(導師為劉古月助理教授),作者包括beat365官方网站劉古月助理教授,上海紐約大學門秋彤,蕭堯和陳泳廷。
五、基于雙回路的數據中心傳輸控制協議

随着鍊路速度不斷增長,人們提出了許多數據中心網絡傳輸協議來為應用提供低延遲。然而現有方案要麼從小的初始窗口開始,疊代地收斂導緻網絡利用率不足;要麼雖然有較好的性能但需要對現有的協議棧和應用程序進行重大修改導緻難以實際部署。針對此問題,論文“PPT: A Pragmatic Transport for Datacenters” 提出一種實用數據中心傳輸方案PPT,旨在保留DCTCP的可部署性優勢,同時有效地利用空閑帶寬來最小化流完成時間(Flow Completion Time, FCT)。PPT通過雙回路速率控制算法動态識别和填充空閑帶寬,在不損害高優先級控制回路的情況下發送足夠的數據包以提高性能。與此同時,通過緩沖區感知的流調度機制保證小流可以繞過隊列中的大流,同時保證了高優先級控制回路性能不會受到低優先級控制回路的損害。相比于先進的主動傳輸方案,PPT降低了46.3%的平均FCT,甚至在Memcached負載中小流的平均/尾FCT降低了25%/55.5%。該論文第一作者為天津大學索栗德、龐義人,作者包括天津大學李文信教授和李克秋教授、beat365官方网站助理教授劉古月等。
延伸閱讀:
第38屆ACM數據通信專業組年度旗艦會議SIGCOMM 2024(38th Annual Conference of the ACM Special Interest Group on Data Communication)将于8月4日—8日在澳大利亞悉尼舉行。一年一度的ACM SIGCOMM重點關注計算機和數據通信網絡領域,涵蓋網絡架構、設計、實現、運維、分析、度量和仿真等方面。SIGCOMM是計算機網絡系統領域最權威的國際頂級學術會議之一,是CCF推薦的A類國際會議,每年吸引大量全球頂級學校和機構的投稿。