本实验室现派出3位学者前往美国长期访学

本实验室现派出余伟(讲师)、甘琳(博士生)、王凯(博士生)前往美国的宾汉姆顿大学(Binghamton University, SUNY)计算机科学系(Department of Computer Science)进行访学,与Weiyi Meng教授在Web数据挖掘领域进行深入的学习和交流,利用数据库与信息检索实验室(Database and Information Retrieval Lab)的实验平台和研究条件展开深入的分析和实验,积极参加各类学术研讨和交流活动,形成相关研究成果。
Weiyi Meng是纽约州立大学宾汉姆顿大学计算机科学系的教授,数据库与信息检索实验室主任,托马斯.沃森工程与应用科学学院副院长,他于1992年伊利诺伊大学芝加哥分校(UIC)获得计算机科学的工学博士学位。Meng教授是Web挖掘和大数据分析等研究领域的国际知名专家,在Web内容挖掘、情感分析、大规模数据集成、数据检索与数据质量等领域有非常高的造诣,出版了相关教科书3本,并先后在国际著名学术期刊与重要国际学术会议(如SIGMOD, VLDB, ICDE, WWW, KDD, ACM SIGIR,TODS,TOIS和TKDE等)上发布关于相关研究论文120多篇,论文的引用次数超过5000多次。Weiyi Meng教授担任过多个国际期刊的编辑,也是多个数据库领域顶级国际学术会议的委员。
通过对Web大数据进行数据挖掘分析,发现蕴含的知识,研究社会运行的规律与发展趋势,是挖掘Web大数据的深层价值和实现社会行为可计算的主要途径。随着互联网技术的普及和社交化平台的大量应用,持续增长的用户数据在规模和复杂性上都有着指数式的攀升,导致传统的数据挖掘和计算方法在性能和效用上遇到了严重的瓶颈。基于内容信息的数据挖掘和基于结构信息的社会计算是目前Web大数据挖掘和社会计算领域的研究热点和难题,主要问题体现在:
1)Web大数据的复杂性
复杂性造成网络大数据存储、分析、挖掘等多个环节的困难。Web大数据的复杂性主要包括数据类型的复杂性、数据结构的复杂性和数据内在模式的复杂性。
2)Web大数据的不确定性
不确定性使得Web数据难以被建模和学习,从而难以有效利用其价值。Web数据的不确定性包括数据本身的不确定性、模型的不确定性和学习的不确定性。
3)Web大数据的涌现性
涌现性是Web大数据有别于其它大数据的关键特性。涌现性在度量、研判与预测上的困难使得Web数据难以被驾驭。Web数据的涌现性主要表现为模式的涌现性、行为的涌现性和智慧的涌现性。
4)缺乏统一的理论体系
大数据的发展是对现有数据科学的巨大机遇和挑战,然后由于其发展较快,统一完备的理论体系尚未形成,使得相关的研究还处于传统方法的性能改进和单方面的研究中。当前的大数据研究与传统数据数据具有了本质的不同。如何在多源异构的Web大数据进行统一的数据抽取、数据集成、知识融合、信息表示和一致性存储?如何形式化的表示Web大数据中的一些问题?如何从理论上判定数据的质量程度和可用性?在缺乏完整的Web大数据理论体系的情况下,这些问题是无法回答的。 这些研究人员回国后将继续依托本实验室在Web数据挖掘领域展开深入和广泛的研究,Web大数据在科学和技术上的突破,将可能诞生出数据服务、数据材料、数据制药等战略性新兴产业。申请人将认真研究相关专业技术,实现Web数据科学与技术的突破,努力解决多源异构大数据产生的复杂性问题,掌握数据冗余与缺失双重特征引起的不确定性,使驾驭数据的高速增长与交叉互连引起的涌现性成为可能。

版权信息:武汉大学web数据挖掘实验室© 13986190968(李教授)shjli@whu.edu.cn