• <u id="saeeq"><wbr id="saeeq"></wbr></u>
  • <s id="saeeq"><div id="saeeq"></div></s>
  • <u id="saeeq"></u>
  • <u id="saeeq"><noscript id="saeeq"></noscript></u>
  • <s id="saeeq"></s>
  • 軟件所王青、石琳課題組榮獲ASE2021 ACM SIGSOFT杰出論文獎

    文章來源:  |  發布時間:2021-10-22  |  【打印】 【關閉

      

      近日,中國科學院軟件研究所互聯網軟件技術實驗室在開源社區群智挖掘研究中取得進展。該研究面向開源社區中的開發者,針對開發者實時聊天內容中大量有價值的“問題-解決方案”信息,提出了一種多層次模型——面向群智的問題及解決方案自動提取技術(ISPY),有效構建了“問題-解決方案”(Issue-Solution)知識庫,實現了當前“問題-解決方案”信息提取性能最優,在促進開源社區知識共享、提升問題解決效率等方面具有重要意義。相關成果以ISPY: Automatic Issue-Solution Pair Extraction from Community Live Chats為題被軟件工程領域頂級會議ASE2021收錄并獲ACM SIGSOFT杰出論文獎。論文第一作者為軟件所副研究員石琳和博士生江子攸,通訊作者為研究員王青。 

      GitterSlack等開源社區實時聊天平臺是目前開發者協作的主要溝通工具,在軟件開發和維護的過程中被廣泛使用。社區聊天中包含了大量有價值的問題-解決方案信息,這些信息能夠有效的提高軟件質量和生產力。比如,開發者可以將項目開發過程中存在的安裝、編譯等問題推送到平臺上,經由其他開發者的回復以解決這些問題。但由于社區群體聊天的對話存在耦合性和復雜性,現有方法難以對其進行挖掘和提取。 

      團隊提出的ISPY模型首先利用多層前饋網絡模型將耦合的對話進行解耦,形成若干獨立的對話;其次,模型基于卷積網絡提取對話的文本特征,基于啟發式規則提取語義特征,基于局部注意力機制提取對話的上下文特征。在預測階段,進行兩步預測,第一步預測對話內容是否討論問題(問題識別),第二步預測對話的內容哪些屬于解決方案(解決方案抽取)。 

      團隊在8個開源社區的4944條聊天數據上測試ISPY模型的準確率、召回率以及調和平均值。在問題識別任務上,ISPY模型超過所有現有指標,調和平均值達到76%,平均提升當前最優基線30%;在解決方案抽取任務上,準確率與召回率指標超過現有基線水平,調和平均值達到63%,平均提升最優基線20%。此外,研究團隊還利用ISPY模型實現了在StackOverflow平臺上自動問答,以6/26的最佳答案、19/26的候選答案被該平臺采納,進一步證明了該模型的有效性和實用性。 

      相關研究得到國家自然科學青年基金、中科院青年創新促進會、中科院軟件所優秀青年科技人才計劃支持。 

      論文鏈接  

      代碼鏈接 

       

      面向群智的問題及解決方案自動提取方法框架 

  • <u id="saeeq"><wbr id="saeeq"></wbr></u>
  • <s id="saeeq"><div id="saeeq"></div></s>
  • <u id="saeeq"></u>
  • <u id="saeeq"><noscript id="saeeq"></noscript></u>
  • <s id="saeeq"></s>
  • 久久久综合香蕉尹人综合网