武汉大学Web数据挖掘实验室成立于2008年,实验室负责人为李石君教授(shjli@whu.edu.cn)。目前实验室有在读计算机专业博士生10人,讲师4人、硕士生26人。

实验室定位为文理交叉、国际合作、人才培养、具有研究-教学-产品转化功能的研究机构。实验室组依托武汉大学计算机学院从事科学研究,面积109平米,拥有一组云服务器和30多台开发计算机,以及Web软件开发平台、ORACLE11g数据库及开发工具、数据挖掘软件等,可供项目组成员从事本项目日常的研究开发任务。实验室长期以来一直从事Web数据挖掘和管理方面研究。深入研究了Web社区、Web用户个性挖掘、Web话题、Web数据源排序方法、中文Deep Web的接口集成、智能Web信息提取;提出了基于数据源质量和覆盖关系对数据源排序的方法,提出了基于HTML模式代数的Web信息提取方法,提出了采用多度量方法查明博客内容的方法。研究成果发表在《计算机学报》和《计算机研究与发展》等国内权威和重要刊物,以及数据库与Web重要国际学术会议(ER, WISE,APWEB,WAIM)上。共发表本项目相关学术论文60多篇,其中SCI检索10篇,EI检索40余篇。

实验室主持了国家自然科学基金面上项目《面向过时信息自动发现的Web时态一致性研究》( No. 61272109,2013-2016)、国家自然科学基金面上项目《Web社区用户个性挖掘与排序研究》( No. 60970018, 2010-2012)和国家自然科学基金一年期小额探索项目《基于数据质量和覆盖估计的deep Web数据源排序研究》(NO:60773007, 2008),基于这两个项目对Web社区、Web用户个性挖掘、Web话题的质量及排序方法进行了深入研究,取得了较好的研究成果。实验室还主持了博士后基金《Web时间不一致建模与过时网页自动发现研究》、湖北省自然科学基金项目《网上信息的自动理解和到XML的转换研究》、中科院计算机科学重点实验室开放课题《HTML数据挖掘技术研究》,武汉大学软件工程国家重点实验室开放课题《基于本体的网上信息到XML的转换与集成研究》。

实验室努力营造浓厚的学术氛围,定期安排学术报告,由学生轮流进行报告,与老师及其它同学讨论自己的研究。此外,实验室内部文体活动丰富,会不定期开展诸如羽毛球比赛和郊游等活动,增强实验室的凝聚力。

本着自强弘毅、求实拓新的精神,我们希望加大和外界同仁的交流,共同推进大数据技术和Web数据挖掘技术的提高,也欢迎有志青年加入我们实验室共同奋斗!

版权信息:武汉大学web数据挖掘实验室© 13986190968(李教授)shjli@whu.edu.cn