軟件所在因果自監督圖對比學習方面取得進展
文章來源: | 發布時間:2024-01-09 | 【打印】 【關閉】
GCL是一種通用的學習范式,旨在從圖中的多樣擾動中捕獲不變信息。近來大量關于GCL的研究著重于從圖中探索結構基本原理,即圖特征中可以引導或解釋模型預測的特定子集,從而增加不變信息的判別準確性。然而,這類方法可能導致圖模型學習到噪聲信息以及任務無關信息,從而影響了模型的預測能力。
為了解決上述問題,研究團隊提出從圖表示中捕獲維度基本原理,并在生化分子數據集PROTEINS和社交網絡數據集RDT-B上進行探索性實驗。實驗通過隨機保留某些維度同時屏蔽其他維度,來探究圖表示維度對模型預測的影響。研究團隊從結果中觀察到保留特定維度的圖表示比原始圖表示具有更好的性能,證明了維度基本原理的存在以及特定的維度基本原理能對GCL的預測起到積極作用。
探索性實驗結果
根據探索性實驗的結果,研究團隊構建了GCL預訓練階段的結構因果模型來闡述維度基本原理R、圖表示E以及圖對比學習標簽Y之間的關系:R既能作用于E又能作用于Y,因此在探究E對Y的直接因果效應時,E←R→Y是一條后門路徑,R是一個混淆變量。由于后門路徑的存在,原始圖神經網絡實際擬合的是R到Y的總因果效應。為了消除后門路徑和混淆變量的影響,研究團隊引入后門準則來干預E、校正R以獲得E到Y的直接因果效應。
結構因果模型
基于上述分析,研究團隊提出了圖對比學習方法DRGCL,其中維度基本原理采用與圖表示維度數量相等的一維向量R實現。DRGCL在預訓練過程中采用傳統GCL范式和元學習范式進行迭代:在第一個訓練步,通過傳統的GCL范式訓練編碼器、投影頭的參數,包括同時最小化對比損失和冗余減少損失;在第二個訓練步,使用二階導數來重加權特定的維度,以保留與任務相關的信息,這被視為維度基本原理的迭代更新,使DRGCL可以在訓練過程中通過后門調整來進行因果干預。
DRGCL框架圖
研究團隊從理論分析和實驗驗證兩方面證明了DRGCL的有效性。在理論方面,通過分析維度基本原理與之前的結構基本原理的關系,發現維度基本原理具有更強的表示能力,是結構基本原理的泛化解;證明了DRGCL能有效限制GCL下游分類損失的誤差界。在實驗方面,通過將DRGCL與多種不同的圖對比學習方法在8個圖分類基準數據集(TU-dataset)上進行對比,證明了DRGCL能更好地捕獲圖數據的判別特征;團隊將DRGCL進一步應用于圖遷移學習基準數據集(CHEM),在處理下游任務方面DRGCL比最優的基線方法提升了0.4%的性能,說明DRGCL能提升圖神經網絡的泛化能力。此外,研究團隊還通過消融實驗和理論分析,證明了DRGCL對圖神經網絡的貢獻及合理性。