[4-26] 軟件所青年聯合會第38期活動--High Performance Data Mining on CUDA-enabled GPUs
文章來源: | 發布時間:2016-05-23 | 【打印】 【關閉】
報告人:劉瑩博士
時間:2016年4月26日 10:00
地點:5號樓四層中會議室
報告摘要:
數據挖掘是從海量數據中挖掘有價值的、新穎的、可理解的知識的技術,目前在很多領域都已有重要的應用。但是,在大數據時代,由于數據量極大、高度復雜、快速多變,已有的數據挖掘軟件已很難滿足應用的實效性的需要。因此,人們對高性能數據挖掘技術的需求十分強烈。圖形處理器(GPU)的最新發展已經能夠以低廉的成本提供高性能的通用計算,基于GPU的并行計算已成為高性能計算領域的最熱門技術,基于GPU的異構并行計算平臺已儼然成為未來高性能計算的主流。另外,基于GPU的CUDA編程模型為程序員提供了充足的類似于C語言的API,便于程序員發揮GPU的并行計算能力。本文將介紹GUCAS-CUMiner ,基于CUDA的并行數據挖掘算法集,包括CU-Apriori、CU-KNN和CU-K-means和CU-Collaborative Filtering。GPU承擔了各個算法中的計算密集部分,并采用了優化技術最大化并發程度和帶寬。實驗結果表明,并行算法在人工合成數據和真實應用的數據上都表現出很好的加速性能。研究結果表明基于CUDA架構的并行數據挖掘是提高數據挖掘技術性能的一個行之有效的途徑。
報告人簡介:
劉瑩,女,博士,計算機與控制學院,教授,數據挖掘與高性能計算實驗室負責人。兼任中國科學院大數據挖掘與知識管理重點實驗室教授。2005 年6 月獲美國西北大學電子與計算機工程系博士學位;2001 年12 月獲美國西北大學電子與計算機工程系碩士學位;1999 年7 月獲北京大學計算機系學士學位。研究方向:數據挖掘、高性能計算、云計算等。已在國際期刊、國際會議上發表論文60余篇。中國計算機學會高性能計算機專業委員會委員。曾擔任2014-2016 International Conference on Information Technology and Quantitative Management高性能數據分析分會主席,2014全國科學數據大會程序委員會共同主席,IEEE International Conference on Data Mining (ICDM 2007) 高性能數據挖掘研討會主席,17th International Conference on Computational Science (ICCS 2007) 高性能數據挖掘研討會主席。2011年獲北京市科學技術二等獎,2010年獲北京市科學技術三等獎。2013年被美國英偉達公司(NVIDIA)授予“全球教學中心”和“全球研究中心”,2014年被英偉達公司(NVIDIA)授予“最佳教學中心”。