江苏师范大学江苏高校优势学科概率统计前沿系列讲座之三十二

发布时间:2014-09-09   浏览次数:116

报 告 人:耿直  教授

报告题目:从数据中发现知识与机制

报告时间:2014910(周三)下午4:00

报告地点:静远楼1506学术报告厅

 

报告摘要:大数据被视为新的重要资源,我国和世界各国都开展了大数据研究计划。2014年科技部973项目,研究非结构数据的统计学习:数学基础及算法。2013年美国NIH资助大数据中心,提出将大数据转化为知识(Big Data to Knowledge, BD2K)2014年美国国防部先进研究项目局提出大机制计划。

传统的基于相关性的数据分析方法是用模型拟合数据,尽管能找到模型和参数足够好地描述和再现数据,但是这种方法缺乏揭示事物之间因果关系的能力,缺乏评价和预测政策效果的能力。我们需要探索能超越传统相关性的方法,挖掘蕴藏在大数据中的“为什么”,提升人类从相关性跳跃到因果的灵感。探讨挖掘庞大的、支离破碎的、有时相互矛盾的大数据,从数据中发现“谁”产生“谁”,揭示产生大数据的因果机制,探索基于因果关系的、有助于制定政策及评价政策效果的数据分析方法。我们将介绍国际上有关因果机制发现的方法,以及国际会议组织的因果挑战和研讨会。我们还将介绍国际上有关因果机制的研究动态,以及我们在相关领域的研究成果。

 

耿直教授简介:

北京大学数学科学学院教授,北京大学统计科学中心联席主任。研究领域为统计理论与方法。研究方向为因果推断、因果网络、不完全数据分析等。研究著名的Simpson悖论和虚假相关问题;提出了替代指标悖论,又称为中间指标悖论;探索评价因果作用的可识别性和分析方法;提出了因果网络结构的分解学习方法、局部学习方法和主动学习方法。研究成果发表在国际上的统计学、生物医学统计、人工智能、机器学习等领域的刊物上。1996年当选为国际统计学会推选会员,1998年获国家杰出青年基金资助项目。现任中国现场统计研究会理事长,中国统计学会副会长, 国家统计局统计咨询委员会委员,国务院学位委员会统计学学科评议组成员,国外和国内多个刊物的编委等职。