近日,2019年度全国统计科学研究项目公示,全国共有151项目获得资助,其中重大项目9项,重点项目40项,我校经济学科方匡南教授申报的项目《多源数据融合的无监督学习方法及其应用》获全国统计科学研究项目重大项目资助,获资助经费15万元。
21世纪是信息爆炸的时代,计算机技术的飞速发展,极大地便利了数据的获取和储存,数据呈指数级增长,越来越多的部门产生和积累了海量的数据,进入了大数据时代。大数据通常是由来源、主体甚至连格式也不同的数据集整合而成,比如来自不同实验室的多组学数据、来自公安、银行、网络等不同领域的征信数据等等。针对这种有多个不同来源的数据集进行建模分析在实际应用中越来越迫切。不同来源的数据集样本量差异较大,研究适用于多源数据融合技术的无监督学习方法,将融合多个数据集的信息,建模过程中互相“借鉴”不同数据集的信息,可以更有效地提取数据的潜在规律,更加适用于高维海量数据的分析。本课题主要研究最常用的两种无监督学习方法,即主成分分析(PCA)和图模型(Graphical Model)。
全国统计科学研究项目面向全国申报,选题参照国家统计局发布的课题指南,主要以统计改革和建设中的重大理论及实践问题为主要研究方向,努力发展和全面繁荣中国统计科学。全国统计科学研究项目每年申报一次,经指南发布、申请受理、资格审查、评审等程序严格产生。
(统计系硕士研究生 黄澜)