4月21日下午,由太阳成集团tyc7111cc、王亚南经济研究院主办,太阳成集团tyc7111cc统计学与数据科学系承办的“太阳成集团tyc7111cc南强学术讲座第1124讲”于线上举行。北京化工大学余乐安教授应邀作了题为“噪声性数据特征驱动的信用风险分类研究”的学术报告。讲座由统计学与数据科学系方匡南教授主持。
余乐安教授首先介绍了我国信用风险体系的发展现状。通过对比美国的征信发展历史,指出我国的信用风险体系发展较晚,信用市场规模及信用卡使用人群占比都较低,目前正处于快速发展阶段,需要加快建立健全统一的社会信用制度。余乐安教授还对国内外现有信用风险分类方法进行了系统梳理,发现信用风险分类中存在很多误区,其中最典型的有两个:第一,盲目套用分类模型,没有考虑数据本身特征对分类模型的影响;第二,数据本身隐含的特征对分类模型选择有重要的影响,不同的数据特征,需要用不同的分类模型来处理。余乐安教授的研究从数据特征中的噪声性特征出发构建相匹配的信用分类模型,以此来提升信用分类的预测效果。
在对已有关于数据特征驱动建模与信用风险分类的相关文献进行梳理后,余乐安教授指出现有文献很少有将信用风险分类、数据特征驱动和噪声处理这三者联系到一起的情况,他基于数据特征驱动建模思想,针对信用数据噪声问题构建一个系统、全面的解决方案,改进最终的信用风险分类结果,将隐藏在分类数据集中的一些典型特征整合为:数量特征、分布特征和质量特征,并分别给出识别与解决方案。
余乐安教授重点针对质量特征中的噪声性,基于信用风险分类中存在的三类噪声数据特征问题(属性噪声、类别噪声和混合噪声),设计了一套针对不同影响程度的噪声数据特征问题的解决方案和模型匹配框架,并通过真实信用数据进行验证。具体而言,首先,在数据噪声特征的驱动下,研究属性噪声、类别噪声和混合噪声对信用风险分类的影响;其次,构建适用于不同噪声数据特征下相应的噪声清洗模型和信用分类模型;最后,将此清洗方法应用于现实数据集,检验该方法的噪声清洗效果和信用分类效果。余乐安教授指出,在未来的研究中,将继续明确数据特征与噪声处理之间的联系,深入研究属性噪声数据删除和信息损失之间的权衡,并避免参数设定中的主观因素,进一步改进噪声清洗和分类结果。
讲座最后,在场师生与余乐安教授就噪声数据的特点、现实数据中小样本分类可能存在的问题等展开了热烈讨论。
(邹至庄经济研究中心 2019级博士生 孙静)