计算机学院“知行讲堂”设立是计算机学院打造的科研学术品牌活动,初衷是通过邀请国内外计算机领域的优秀学者定期来院分享最新、最热的前沿技术,给学院师生们搭建一个高效、高质、稳定的学术沟通平台,进而达到活跃学术氛围,促进学术碰撞,提升学术水平,打造学术品牌,助力人才培养的目标

2018年11月29 计算机学院知行讲堂”第邀请到中国人民大学信息学院教授、院长文继荣做了题为大数据近似算法精彩报告

文继荣教授提出在大数据时代,随着数据规模的不断提升,很多多项式时间可解的问题也变得难以计算。近来年,利用近似算法解决由数据规模扩大带来的时间/空间/通讯量效率问题成为了学界热点。并指出大数据近似算法的核心思想在于通过引入可控误差,将大数据转换为统计意义上与元数据非常相似的“小数据”。最后,展示大数据近似算法中常用的采样(sampling)、略图(sketch)、摘要(summary)等技术,以及这些技术在结构化数据、流数据、矩阵数据以及图数据中的应用。

 

此次报告座无虚席、提问不断、精彩纷呈,在座师生了解到在大数据分析领域,一些宏观上具有统计意义的数据刻画变得更为重要,近似算法产生的小数据与元数据相比虽小几个数量级,但使得系统的实时响应和对数据的实时分析成为可能。这也正是近似算法的奥妙所在。

讲座由计算机学院李浥东副院长主持,来自各系所、团队师生近60人参加讲座。

文继荣,1994年和1996年于中国人民大学分别获得学士和硕士学位,1999年于中科院计算所获得博士学位,并在随后加入微软亚洲研究院,自2008年担任高级研究员和互联网搜索与数据挖掘组主任。2013年9月加入中国人民大学,目前担任信息学院教授、院长,大数据管理与分析方法研究北京市重点实验室主任。主要研究方向是大数据管理和分析、信息检索、数据挖掘和机器学习,尤其擅长跨领域的研究和大规模数据系统的开发。至今已在国际著名学术会议和期刊上发表论文170多篇,总计引用12000多次,H-Index为49,担任ACM TOIS和IEEE TKDE的编委。在系统和软件产品开发方面做了大量的工作,获得了49项美国专利,领导了微软学术搜索、人立方等系统的开发,全面参与了微软搜索引擎Bing的讨论、设计和实现。这些系统有上亿的用户使用,具有广泛的影响力。