研工在线

“你还在为数据发愁吗”

发布日期:2020-12-11 发表者:宗明绪 浏览次数:

2020128日下午,以“数据的清洁之路”和“六度空间下的网络遨游”为主题的两场信息学院学术社区相继在逸夫楼C314拉开帷幕,信息学院研究生王子林、孙伟成和张平同学进行了展示和分享,来自各个学院的研究生同学们积极参与了本次活动。

王子林同学首先向大家解释了为什么要开展这样的学术社区活动,他说:“举办学术社区活动的目的是提供一个学术交流的平台,以大家在科研中遇到的问题为核心,进行交流探讨,互相借鉴经验。虽然大家研究的方向可能各不相同,但是学科的交叉能够碰撞出思维的火花,探索解决问题的新思路。”

“什么是数据挖掘?”王子林同学向大家提出了问题。“数据挖掘的本质就是利用算法从数据中发掘事物的内在联系,发现联系并不难,难的是如何从海量的数据中发现普遍规律,”接下来王子林介绍了数据预处理的常用方法和探索性数据分析的手段,“如果把数据挖掘比作一个矿山,数据预处理就好比勘测矿石的位置,数据分析就是挖矿的工具,只有方向对了,工具好使,才能挖到金矿。”

“实践出真知”孙伟成同学在王子林同学介绍完数据挖掘的理论之后便开始了代码的现场演练,“让我们从泰坦尼克号数据集和青春有你2选手的数据集中看看能找到什么有价值的东西。”孙同学一边讲解着自己的“勘测手段和工具”,一边展示着自己挖到的各种“财宝”,随着孙同学的手指在键盘上敲击,一幅幅漂亮的统计图出现在了屏幕上,数据挖掘的实战演练也接近了尾声。

“在看到信息学院的本次研讨会通知,我非常心动,因为恰好在自学数据分析,也遇到了很多坑,所以这次是带着疑问来到研讨会,”生科院的段磊磊同学在讨论结束后说道,“听完之后我感觉对我的工作很有启发,今天学习到的这些方法让我跃跃欲试。”

经过茶歇和自由交流之后,一个有趣的提问带我们进入了下一场精彩的报告:“世界上的任意两个人需要中间的几个人即可相识?”张平同学从六度分隔理论引出图神经网络及其应用,“随着图神经网络的发展,可以预见这种建模利器,能够有效的处理非欧数据的数据挖掘问题。”

“作为机械专业的研究生,我觉得我的能力还有很多地方需要提高,应该多元化发展,人工智能是大趋势,我们应该在这方面好好学习。”工学院的徐洋在听完报告之后不无感慨的说道。园林院的李航也感同身受:“多学科交叉是一种很好的方式,对于我从事的研究课题,有很多借鉴意义,以后有机会希望能多参加这样的研讨会。”