俞扬,博士,南京大学教授;主要研究领域为机器学习、强化学习;分别于2004年、2011年获得南京大学计算机科学与技术系学士学位和博士学位;获2013年全国优秀博士学位论文奖、2011年CCF优秀博士学位论文奖;发表论文40余篇,包括多篇Artificial Intelligence、IJCAI、AAAI、NIPS、KDD等,获国际论文奖励4项和国际算法竞赛冠军2项,入选2018年IEEE Intelligent Systems杂志评选的“国际人工智能10大新星”,获2018亚太数据挖掘“青年成就奖”,受邀在IJCAI’18作关于强化学习的“青年亮点”报告。
       9月11日下午,南京大学俞扬教授在育贤楼C502为我院师生作题为《物理世界决策学习:环境虚拟—强化学习—模型重用的途径》的学术报告。报告由电气工程系主任卢伟主持。
       俞扬教授对强化学习作了简单介绍,从围棋、视频游戏等领域介绍了其研究的主要内容。他通过与淘宝合作的案例,讲述了“环境虚拟—强化学习—模型重用”的途径,阐明了该途径对于有历史数据积累的应用领域,实现了零试错代价的决策学习。最后,俞扬教授详细介绍了“环境虚拟—强化学习—模型重用”这一途径在天猫和菜鸟驿站派件上的应用,通过优化算法,模拟工人工作环境,对工作效率进行统计,并进行数据分析,最后成功提高了派件效率,使大家对决策学习在现实生活的应用有了更加具体的认知。
       报告结束后,与会师生与俞扬教授进行广泛讨论与交流。俞扬教授的报告精彩生动,充满感染力,与会师生受到了新的启迪,对决策学习有了更深层次的理解。