• <u id="saeeq"><wbr id="saeeq"></wbr></u>
  • <s id="saeeq"><div id="saeeq"></div></s>
  • <u id="saeeq"></u>
  • <u id="saeeq"><noscript id="saeeq"></noscript></u>
  • <s id="saeeq"></s>
  • [12-11]Argumentation Accelerated Reinforcement Learning for Cooperative Multi-Agent Systems

    文章來源:  |  發布時間:2014-12-10  |  【打印】 【關閉

      

    報告題目:Argumentation Accelerated Reinforcement Learning for Cooperative Multi-Agent Systems

    報告人:高揚博士

    時間:2014年12月11日 下午1:30

    地點:軟件所5號樓4層中會議室

    報告摘要:

    強化學習(Reinforcement Learning)被廣泛應用在機器人控制、多智能體系統等領域。其突出特點是可以進行連續決策(sequential decision making),并僅需要較少的人工指導信息。但強化學習面臨的最大問題是其收斂速度較慢。我們利用論辯邏輯(Argumentation logic)將人的先驗知識進行整理和歸納,然后利用這些經過處理的先驗知識來指導強化學習,以提高其收斂速度。我們提出的方法在多個鄰域得到應用,如足球機器人、家用電器使用調度系統等,相較于其他的強化學習算法,我們的方法具有一定的優勢。

    報告人介紹:

    高揚,男,現為英國帝國理工學院博士后。2011年6月獲得西北工業大學計算機科學與技術專業工學學士學位,2011年10月起由國家留學基金委資助在帝國理工學院攻讀博士學位。主要研究方向為強化學習,論辯邏輯和多智能體學習系統。本科期間代表西北工業大學參加數次全國和國際機器人足球大賽,多次獲得冠軍。從2012年起在人工智能主要會議上(ECAI,AAMAS)發表論文數篇。

  • <u id="saeeq"><wbr id="saeeq"></wbr></u>
  • <s id="saeeq"><div id="saeeq"></div></s>
  • <u id="saeeq"></u>
  • <u id="saeeq"><noscript id="saeeq"></noscript></u>
  • <s id="saeeq"></s>
  • 久久久综合香蕉尹人综合网