English  |   学校主页  |   收藏本站

人工智能算法在统计建模中的应用 ——记统计研究学会学术讲座

随着2021年(第七届)全国大学生统计建模大赛的启动,我院给予充分重视,积极组织学生报名参加,旨在在学院中倡导学习统计、应用统计的良好氛围,促进关注社会、经济、科学技术中的热点难点问题,提高大学生数据挖掘、数据分析、运用统计方法及计算机技术处理数据的能力,加强创新思维意识,适应大数据时代各行各业对数据分析人才的要求,助力推进一流统计人才培养。在鼓励学生参赛的同时,学院也广泛调集师资力量,组织大赛培训讲座和学生参赛指导。

20215121900,统计研究学会邀请上海财经大学澳门新萄京665535张立文副教授举行了讲座。本次讲座中,张立文教授主要向大家介绍了人工智能的历史和现状,并向大家简要说明回归分析、机器学习、深度学习、推荐系统等人工智能模型理论思想,还详细介绍了Python语言,并给出了相关案例。


讲座伊始,张立文教授简要介绍了人工智能的三大方向——语音识别、计算机视觉、自然语言处理,以及人工智能发展的近况:依然处于弱人工智能阶段、在数据、算法、算力三大核心下快速发展。此外,张教授运用“七步成诗”的比喻,清晰生动地展示了深度学习的框架,并从本质上揭露了机器学习与强化学习的区别:机器学习本质在于预测,而强化学习的本质是动态决策。

之后,张立文教授向我们详细介绍了机器学习。他首先引入了一个重要概念——监督,并围绕监督画出机器学习的整体轮廓。何为监督?正如妈妈作为“监督者”教小孩辨认水果的颜色,将一种水果与一种颜色建立对应关系,机器学习中的“监督”就是教会计算机通过某种途径联立“特征”与“标签”间的关系,从而也拥有了辨认、学习乃至预测的能力。由此,张立文教授说明了进行机器学习的三个维度——历史数据、任务、执行,还指出了机器学习的未来方向——无监督性,也就是像人类一样自主学习。但目前大多数方法仍然是监督性的,这就需要我们不断地用各种不同的算法进行矫正,以提高机器学习的准确性。

接着,张立文教授介绍了深度学习。他由人脑的信号传播引入,指出人脑通过电信号高低传递信息,而所谓深度学习如同人脑的神经元网络,即便是复杂的模型也是神经元结构的推广,将复杂技术背后的简单原理展现给我们。之后,他简单描述了神经网络模型的算法,并举了预测股票趋势的例子。但由于神经网络的复杂性,最终我们得到的往往是结构简单,计算量却极为庞大的复杂的函数,这个问题在计算机算力发展后也能得到解决。


最后,张立文教授向我们介绍了Python语言。Python是一个面向对象的,解释性强的语言,特点在于有很多的库,并且跟很多语言都可以做链接。张教授还简单指导了学习Python的方法:先从基础做起,还要注意循环和控制。之后,张教授展示了几个广泛使用的库,并举了几个案例,结合之前神经网络的知识,进行房价预测和文本数据处理。

最后,张立文教授提醒同学们,为了统计建模,需要深入学习讲座中涉及到的知识,如果要做强化学习、推荐系统等更深入的研究,还需要涉猎其他方面的知识,希望同学们在这场讲座中有所收获。

广泛动员学生参与建模大赛,积极搭建名师讲座等平台,是统计学院打造一流统计学科建设的重要组成部。学院积极推进以实践为中心的人才培养改革,通过二课实践、学术讲座和校企合作等形式,实现学生多方位创新和能力提升的重要方式和途径,进一步落实人才培养的实践。

供稿:统研会 供图:统研会 审阅:吴纯杰