您現在的位置: 首頁 » 學院新聞 » 新聞動态 » 正文

學院新聞

新聞動态

 

beat365圖形與交互技術實驗室汪國平教授與李勝研究員的研究團隊在ACM SIGGRAPH系列會議上取得系列進展。ACM SIGGRAPH和SIGGRAPH Asia是計算機圖形學與交互技術領域最具權威性的年度學術會議(CCF A類)。該系列會議以理論、方法的創新性和技術貢獻方面審核嚴苛而聞名,論文成果往往工作量浩大、研究周期長、技術挑戰高,而錄取率一般20%左右。本年度,該研究團隊共接收/發表6篇長文(regular technical paper),其中SIGGRAPH2篇,SIGGRAPH Asia4篇, 所有論文均在大會做口頭報告。

 

1.      Proxy Tracing: Unbiased Reciprocal Estimation for Optimized Sampling in BDPT

基于全局光照的高度真實感渲染是圖形學的核心問題之一,魯棒的光傳輸算法,特别是雙向路徑追蹤(BDPT),在處理涉及鏡面反射或高度光滑等困難路徑時面臨重大挑戰,采樣十分困難。為了解決這個問題,論文提出了一種稱為代理采樣的新方法,該方法可以有效地連接這些難以采樣的路徑。新構建完整路徑确保連接遵循鏡面/光滑表面的窄葉BSDF約束。無偏的倒數積分的估計是方法的關鍵,用于獲得與無偏渲染相一緻的概率密度函數(PDF)。方法顯著地提升了BDPT渲染方法的效率,并可以高效地采樣那些困難的路徑,從而提升渲染效果。

論文發表于SIGGRAPH’24期刊軌(ACM Transactions on Graphics期刊),共同第一作者為實驗室研究生蘇複佳和本科生李秉軒,合作者包括本科生尹清揚、章嚴晨、李勝研究員(通訊作者)。

 

2.      DiffSound: Differentiable Modal Sound Rendering and Inverse Rendering for Diverse Inference Tasks

準确估計和模拟物體的物理屬性從現實世界的聲音錄音中提取,對于視覺、圖形和機器人等領域具有重要的實際意義。以往的剛體或軟體模拟技術無法直接應用于模态聲音合成,因為音頻的高采樣率,而以前的聲音合成器往往未能充分建模發聲物體的準确物理屬性。論文提出了DiffSound,一種用于基于物理的模态聲音合成的可微聲音渲染框架,該框架基于隐式形狀表示、新的高階有限元分析模塊和可微音頻合成器。論文方法能夠解決廣泛的逆向問題,包括物理參數估計、幾何形狀推理和撞擊位置預測。

論文發表于SIGGRAPH’24會議軌,共同第一作者為實驗室直博生金旭統和碩士生徐晨曦,合作者包括斯坦福大學助理教授吳佳俊、馬裡蘭大學助理教授高若涵、汪國平教授、李勝研究員(通訊作者)。

 

3. Neural Laplacian Operator for 3D Point Clouds

圖形學中幾何處理中的核心算子之一是拉普拉斯算子,其在物理仿真、幾何計算等下遊應用中具有重要地位。拉普拉斯算子起初定義在流形上,在三角網格和多邊形網格等具有拓撲結構的三維表示方式中可以較為自然地推廣,但對于點雲這樣的缺乏拓撲信息的無序結構而言,構建拉普拉斯算子及進行後續運算是非常困難的。論文探究了如何在不構建三角化或重建網格的情況下,通過觀察拉普拉斯算子的性質,利用圖神經網絡估計點雲上的拉普拉斯算子。為了訓練網絡,提出了一種新的訓練方案,通過構建一個個“探測器”,不斷“探測”目标拉普拉斯算子的性質,從而訓練出一個具有泛化性的,用于預測點雲上拉普拉斯算子的圖神經網絡。論文被SIGGRAPH Asia’24期刊軌(ACM Transactions on Graphics期刊)接收,第一作者為實驗室直博生逄博,合作者包括研究生鄭中天、李翼龍、汪國平教授(通訊作者)和王鵬帥助理教授(通訊作者)。

 

4. Barrier-Augmented Lagrangian for GPU-based Elastodynamic Contact

彈性體接觸仿真是圖形學仿真中最具挑戰性的問題之一,Incremental Potential Contact (IPC)作為近年來圖形學與接觸力學領域的重要突破,提供了深刻的數學建模。然而,其實現通常依賴于帶障礙函數的非線性優化,并涉及複雜且計算密集的矩陣運算。由于矩陣病态性,IPC的實現往往需要采用直接法進行計算,但直接法的矩陣分解過程導緻内存占用極大。針對上述問題,論文對IPC模型實現了高效優化方法。具體來說,論文提出了基于障礙的增廣拉格朗日疊代模型,用預條件共轭梯度(PCG)替代了直接法來求解子線性系統。同時,對超大規模稀疏矩陣的存儲方式進行了革新,跳過了稀疏矩陣模式(pattern)的計算,在确保稀疏性存儲的基礎上完全省略了這一步驟。得益于此優化,方法在IPC基礎上實現了近百倍的計算效率提升,且由于取消了矩陣分解,内存開銷從128G以上降低到隻需8G,而且還能解決剛性的病态問題。論文被SIGGRAPH Asia’24期刊軌(ACM Transactions on Graphics期刊)接收,第一作者為實驗室博士生郭德聞,合作者包括CMU助理教授李旻辰和猶他大學副教授楊垠、李勝研究員(通訊作者)和汪國平教授(通訊作者)。

 

5. Efficient Neural Path Guiding with 4D Modeling

以往的路徑引導策略使用3D的數據結構來建模空間位置與入射輻射度分布間的關系,但較難建模除空間位置(3D)之外的維度,例如動态場景在時間維度上的變化。而将這些數據結構直接擴展到更高的維度卻常因維度詛咒而導緻運行低效。論文探究如何由緊緻的神經隐式表示來高效地建模輻射分布所依賴的額外維度,從而增強路徑引導算法在特定渲染應用中的性能,例如光譜渲染與動态場景中的運動模糊效果。具體而言,論文使用特征平面分解的策略建模空間位置與額外維度間的相關性;同時提出使用漸進式的訓練策略近似這種相關性,從而避免額外的數據結構開銷。論文在若幹典型的渲染應用與困難場景下體現了優勢。論文被SIGGRAPH Asia’24會議軌接收,第一作者為實驗室碩士生董宏昊,合作者包括研究生蘇睿、汪國平教授、李勝研究員(通訊作者)。

 

6. Dynamic Neural Radiosity with Multi-grid Decomposition


神經渲染是一種嶄新的利用AI實現真實感渲染的技術。然而,現有基于神經網絡的動态場景全局光照方法,由于模型複雜性較高,每幀圖像生成耗時較長,導緻幀率較低。為了解決這一問題,論文提出了一種特征分解方法。該方法将動态場景向量與空間坐标構成的高維特征分解為三部分:三維空間網格特征、多個二維時空平面特征以及頻率編碼的向量間特征,從而解決了維度災難問題,實現了一種高效的高維特征表示方式。同時,該方法在動态場景向量空間中均勻采樣,并通過渲染方程的殘差訓練神經網絡,最終生成視角無關的動态場景輻射場。與現有神經渲染方法相比,該方法不僅提高了圖像質量,還将幀率提升了約3.5倍,支持交互時間内渲染動态場景。論文被SIGGRAPH Asia’24會議軌接收,論文第一作者為直博生蘇睿,合作者包括實驗室研究生董宏昊、任傑瑞、金浩傑,以及陳毅松老師、汪國平教授和李勝研究員(通訊作者)。