《物理世界决策学习：环境虚拟—强化学习—模型重用的途径》

2019-09-11 智能机器人实验室

俞扬简介

俞扬，博士，南京大学教授；主要研究领域为机器学习、强化学习；分别于2004年、2011年获得南京大学计算机科学与技术系学士学位和博士学位；获2013年全国优秀博士学位论文奖、2011年CCF优秀博士学位论文奖；发表论文40余篇，包括多篇Artificial Intelligence、IJCAI、AAAI、NIPS、KDD等，获国际论文奖励4项和国际算法竞赛冠军2项，入选2018年IEEE Intelligent Systems杂志评选的“国际人工智能10大新星”，获2018亚太数据挖掘“青年成就奖”，受邀在IJCAI’18作关于强化学习的“青年亮点”报告。

俞扬教授应邀作学术报告会

9月11日下午，南京大学俞扬教授在育贤楼C502为我院师生作题为《物理世界决策学习：环境虚拟—强化学习—模型重用的途径》的学术报告。报告由电气工程系主任卢伟主持。

俞扬教授对强化学习作了简单介绍，从围棋、视频游戏等领域介绍了其研究的主要内容。他通过与淘宝合作的案例，讲述了“环境虚拟—强化学习—模型重用”的途径，阐明了该途径对于有历史数据积累的应用领域，实现了零试错代价的决策学习。最后，俞扬教授详细介绍了“环境虚拟—强化学习—模型重用”这一途径在天猫和菜鸟驿站派件上的应用，通过优化算法，模拟工人工作环境，对工作效率进行统计，并进行数据分析，最后成功提高了派件效率，使大家对决策学习在现实生活的应用有了更加具体的认知。

报告结束后，与会师生与俞扬教授进行广泛讨论与交流。俞扬教授的报告精彩生动，充满感染力，与会师生受到了新的启迪，对决策学习有了更深层次的理解。