位置:首頁 > 新聞動態 > 綜合新聞  
數據科學的理論與應用—記分子系統中心第十四期“未來科學沙龍”

  201987日下午,由中國科學院遗传与发育生物学研究所分子系统生物学研究中心主办未來科學沙龍十四期于研究所職工之家順利舉行。本場沙龍以數據科學主题,介绍了企业界數据分析的重要步骤、何爲數據科學家以及數據科學家的必备技能。分子系统生物学研究中心王秀杰研究员、钱文峰研究员和屠强研究员出席了本次活动,所内各研究组职工、博士后、研究生共五十余人参加了本场沙龙,现场讨论、交流气氛活跃。 

 

  本场沙龙由来自腾讯公司的特邀嘉宾陈峭霖博士担任报告人。陈峭霖博士首先结合自身从事數据挖掘工作经验,分享了成爲一个优秀數據科學家的心得。作爲一个多学科交叉的新兴职业,數據科學家要对统计学、计算机科学以及相关领域知识都有一定的了解。接着,陈峭霖博士以其工作中的案例,介绍了在企业界數据分析的几个重要步骤,包括问题定义、數据的收集与清理、模型的选择与评估,并强调要及时根据实际情况对模型进行调整和优化。此外,陈峭霖博士还向大家列举了數據科學家应当掌握的必备技能,同时建议涉足數据分析的同学要适当地拓展自己的建模技术工具箱,并根据实际分析的數据选取合理的分析方法。对于小數据集,支持向量机、随机森林等算法具有明显优势,而对于大样本數据,则倾向于选择深度神经网络。报告结束后,参与沙龙的老师和同学从据分析方法的选择、數据分析在生物制药的应用、如何快速融入新的工作岗位、以及职场中的人脉建立和职业规划选择等多个角度进行了热烈而深入的讨论。本场沙龙的举办让与会师生初步了解了企业界數据分析的基本流程以及數據科學家的日常工作,引导了大家对如何更好地掌握与应用數據科學技术进行思考。 

 

  未來科學沙龍作爲分子系统生物学研究中心定期举行的学术活动,将陆续由老师和学生提出议题。希望通过沙龙的举行,拓展大家的知识面与视野,增进彼此间的交流与合作,爲师生的课题研究提供新的思路,推动创新性成果的产生。未來科學沙龍非常欢迎研究所其它中心师生的参与。