【12月19日】统计学学术讲座
信息来源:
作者:
发布时间:2021-07-03
报告题目: 吉布斯采样随机搜索大数据分析
主讲人:钱国骐教授(墨尔本大学)
时间:2018年12月19日(周三)9:30a.m.
地点:北院卓远楼305
主办单位:统计与数学学院
摘要: 大多数用于统计机器学习和大数据分析的算法都是确定性和列举性的。在变量选择或模型选择时挖掘仅包含几百个特征值或预测值的数据集在计算上也是难以处理的。在过去的20年中,我们一直在开发吉布斯采样(Gibbs sampling)诱导的随机搜索方法,以随机采样候选模型或预测变量子集,然后基于生成样本进行模型/变量选择。由于生成的样本只是指数级候选模型空间的一小部分,因此随机搜索在计算上可扩展到大数据分析。并且生成的样本通常也构成一个遍历马尔可夫链;因此,模型或变量选择的一致性以概率1得到了保证。本次报告我们将简要回顾一下吉布斯采样诱导随机搜索方法。如果时间允许,我们将在市场购物篮分析,全基因组关联研究,蛋白质组学信息检索,热带气旋成因研究和野生动物种群丰富度研究中提出一些应用。
钱国骐,加拿大达尔豪斯大学统计学博士,墨尔本大学数学与统计学院的教授,主要从事统计学和数据科学理论和方法研究,包括计算统计学,机器学习,计量经济学,基因组学,统计气候学和理论统计学。在国际学术期刊《Biometrika》、《Computational Statistics and Data Analysis》、《Statistical Sinica》等上发表了55篇学术论文(包括两个计算软件包),指导了6名博士、6名荣誉学位者和30名理学硕士研究生完成学业。研究获得澳大利亚研究委员会(ARC)和国家健康与医学研究委员会(NHMRC)的资助。
主讲人:钱国骐教授(墨尔本大学)
时间:2018年12月19日(周三)9:30a.m.
地点:北院卓远楼305
主办单位:统计与数学学院
摘要: 大多数用于统计机器学习和大数据分析的算法都是确定性和列举性的。在变量选择或模型选择时挖掘仅包含几百个特征值或预测值的数据集在计算上也是难以处理的。在过去的20年中,我们一直在开发吉布斯采样(Gibbs sampling)诱导的随机搜索方法,以随机采样候选模型或预测变量子集,然后基于生成样本进行模型/变量选择。由于生成的样本只是指数级候选模型空间的一小部分,因此随机搜索在计算上可扩展到大数据分析。并且生成的样本通常也构成一个遍历马尔可夫链;因此,模型或变量选择的一致性以概率1得到了保证。本次报告我们将简要回顾一下吉布斯采样诱导随机搜索方法。如果时间允许,我们将在市场购物篮分析,全基因组关联研究,蛋白质组学信息检索,热带气旋成因研究和野生动物种群丰富度研究中提出一些应用。
钱国骐,加拿大达尔豪斯大学统计学博士,墨尔本大学数学与统计学院的教授,主要从事统计学和数据科学理论和方法研究,包括计算统计学,机器学习,计量经济学,基因组学,统计气候学和理论统计学。在国际学术期刊《Biometrika》、《Computational Statistics and Data Analysis》、《Statistical Sinica》等上发表了55篇学术论文(包括两个计算软件包),指导了6名博士、6名荣誉学位者和30名理学硕士研究生完成学业。研究获得澳大利亚研究委员会(ARC)和国家健康与医学研究委员会(NHMRC)的资助。
学科 | 讲座时间 | ||
主讲人 | 讲座地点 |