10月13日 江苏高校优势学科概率统计前沿系列讲座之一百一十二

发布时间:2018-10-09   浏览次数:278

报 告 人:王汉生 教授

报告题目:A Popularity Scaled Latent Space Model for Large-Scale Directed Social Network

报告时间:2018年10月13日(周六)上午11:20

报告地点:金晨假日酒店正德厅

报告人简介:

  王汉生教授,北京大学光华管理学院商务统计与经济计量系,嘉茂荣聘讲席教授,博导,系主任。北京大学商务智能研究中心、主任。微信公众号“狗熊会”创始人。美国统计学会Fellow(2014),国家杰出青年基金获得者(2016)。1998年北京大学数学学院概率统计系本科毕业,2001年美国威斯康星大学麦迪逊分校统计系博士毕业。2003年加入光华至今。国内外各种专业杂志上发表文章七十余篇,并(合)著有中英文专著各一本。国际统计协会、英国皇家统计协会、美国数理统计协会(、泛华国际统计协会的会员。美国统计协会2014年Fellow。先后历任以下国际学术刊物副主编(Associate Editor):The Annals of Statistics (2008—2009), Computational Statistics & Data Analysis (2008—2012),Statistics and its Interface (2010—现在), Journal of the American Statistical Association (2011—现在),以及Statistica Sinica (2011—现在)。Journal of Business and Economics Statistics (2012—现在), Science China: Mathematics (2013—现在)。

  在理论研究方面,主要关注变量选择、数据降维、高维数据分析、以及复杂网络数据分析。所有这些研究都以大规模、复杂、超高维数据分析维核心。其相关的应用领域包括但不局限于:中文文本、网络结构、位置轨迹。在业界实践方面,王汉生教授是国内较早从统计数据分析角度关注并研究搜索引擎营销,社交网络数据,以及位置轨迹数据分析的学者。曾担任博雅立方科技有限公司首席科学家(2009—2015),百分点首席统计学家(2015—现在)。此外,量帮科技、考拉征信、彩虹无线、蓬景数字等众多企业有深度学术合作。涉及量化投资、互联网征信、车联网、移动设备RTB广告竞价、搜索引擎营销、电子商务等多个重要行业。此外,王汉生教授同腾讯、百度、阿里、奇虎、奥迪、京东、联通等众多企业有短期项目、或者培训会议合作。

报告摘要:

  Large-scale directed social network data often involve degree heterogeneity, reciprocity, and transitivity properties. A sensible network generating model should take these features into consideration. To this end, we propose a popularity scaled latent space model for the large-scale directed network structure formulation. It assumes for each node a position in a hypothetically assumed latent space. Then, the nodes close (far away) to each other should have larger (less) probability to be connected. As a consequence, the reciprocity and transitivity properties can be analytically derived. In addition to that, we assume for each node a popularity parameter. Those nodes with larger (smaller) popularity are more (less) likely to be followed by other nodes. By assuming different distributions for popularity parameters, different types of degree heterogeneity can be modeled. Furthermore, based on the proposed model, a comprehensive probabilistic index is constructed for link prediction. Its finite sample performance is demonstrated by extensive simulation studies and a Sina Weibo (a Twitter-type social network in China) dataset. The performances are competitive.