最近,在南京大学人工智能学院,一场特殊的面试在进行。13个大学生要角逐5个名额,参加即将举行的“2023腾讯开悟多智能体强化学习全国高校公开赛”。未来几个月,他们有充足的时间开展多智能体强化学习,理解越深的学生,将会越受青睐。
(资料图)
在专业学科圈子里,这项竞赛被简称为“开悟AI大赛”,目前已举办三届。参赛者们“以赛代研”,研发游戏AI,进行王者荣耀对抗赛。通过多轮次的对战、迭代,以研发出更好更强的AI智能体。
这些重视体现了这场比赛的分量。对于高校,腾讯的开悟大赛和开悟平台是难得的对于AI人才的实训机会。在算法研究过程中,高校面临缺乏真实数据与硬件基础的痛点,是中国AI人才培养的掣肘。他们希望选出那些对多智能体强化学习有坚定科研意向的学生。
学生利用开悟平台进行AI研究
10的20000次方种可能
学生们的热情响应 ,和AI目前的火热互相呼应。南京大学人工智能学院副教授赵一铮认为,近期AI发展带来的热度,让普通民众突然意识到AI其实离生活非常近,它不止停留在企业级应用,而是可以解决很多细小的生活中的问题,因此引发了全民对AI技术本身的兴趣和追逐。
AI对数据要求量极大,否则无法达到人类正确识别的程度。针对这个问题,产学研各界都开始发力追赶。已经举办三届的开悟比赛的举办也正是怀抱类似动机,因为游戏是绝佳的AI实验场。腾讯开悟平台,恰好能为中国自主知识产权的人工智能底层技术研究、人工智能应用场景拓展,提供助力和支持。
一局游戏中,预计有高达10的20000次方种操作可能性,而整个宇宙原子总数也只是10的80次方。海量数据需要计算,搭建算力平台需要大量GPU。依托于王者荣耀和腾讯AI Lab在算法、算力方面的核心优势,“腾讯开悟”向为学术研究人员和算法开发者开放。
“能把实验室里学到的东西搬出实验室,走进实际的大型项目来说,是一个非常难得的机会。”中国科学技术大学博士赵鉴是游戏爱好者。在第一届比赛时,看到比赛能提供稀缺算力,又能把兴趣跟研究方向相结合,他毫不犹豫地就报名了。在那届比赛中,他的团队取得了第一名。以往,他在实验室里接触到的都是小型化的理想实验环境,但通过比赛,能够获得落地的、复杂,大型的实验环境,“开悟平台提供的海量算力,是以往在实验室环境是很难提供的,供我们去频繁试错,创新,尝试一些新的算法”。
在他的示范效应下,这两三年,中科大的学生踊跃参赛。去年,中科大跟腾讯合作开办了机器博弈课程,正是借助游戏平台以及开悟平台的底层能力。这门课程教导学生智能决策强化学习的知识,并最终要求他们在开悟平台上搭建一个能够实现对战的AI。学生报名踊跃,由于开放的资源有限,课程限制30位人选,但报名的人数远超预期。直到现在,还有很多学生询问今年会不会继续开设这一课程。
赵鉴认为,学生本身对游戏有很大的兴趣,而通过游戏能够学习到人工智能的前沿技术,更容易激励他们的开发热情和学习兴趣。
赵鉴在STAC大会上分享个人学习经历
过去一年,开悟在高校开设的课程也出现了很多新变化。今年,开悟课程放逐渐扩面,覆盖至19所高校、超20个班级的学生;参与王者AI相关课程的学习的学生累计超630名;北大还将开设200多位学生参与的大班教学。未来三年,这个项目计划争取支持到全国更多高校开设人工智能相关课程,并开展全国师资培训,帮助AI高校教育的普及和能力提升。
升级AI人才培育解决方案:更普惠,更好用
游戏AI课程的受欢迎,也是因为开悟平台提供了便捷开发的环境,它的分布式强化学习的框架,可以有效帮助学生实现各类的强化学习的决策AI,对学习和科研都有很大帮助。
过去两年,“腾讯开悟”在高校的知名度越来越高。今年的开悟比赛由邀请制改为公开赛。今年,腾讯开悟平台也将进行平台优化,将客户端版本调整为web版本;并在拓展新的迷宫地图,相比传统的峡谷PVP地图,使用将更加简单。
便捷的工具及厚实的基底,让学生们在过程中可以将全部精力更投入于算法创新。当初次参赛的3-5人的学生团队,在1—2月时间内就创造出属于他们的王者AI,“给我们带来很大的成就感”。
赵一铮预期,由AI最新发展所引发的热潮将持续推动大学人工智能专业的报考人数稳步增长。这对于学校开设更多的人工智能专业课程、扩充师资队伍以及提升教学质量,都构成了积极的挑战。
在学院的课程设置中,多智能体强化学习是人工智能领域的热门研究方向,相关课程也是学院的重点课程,吸引了大量的学生参与。赵一铮特别强调,引入开悟平台后,课程的吸引力进一步提升。开悟平台让学生能够将课堂上学习的理论知识及时转化为实践,这种切身感受的反馈,对于人工智能人才的培养起到了积极的推动作用。以往,大学教学中往往缺乏这样能提供强大算力、持久数据和实际业务场景的平台。
这也是赵一铮与其他同事精心选拔学生参加比赛的原因:比赛是最生动的教学和科研场景,比赛中的直接反馈更具震撼力,这种参与感对学生来说是极大的鼓舞。
AI产业发展有了三条“新纽带”
中科院自动化所博士何金岷发现,目前不论是大语言模型,还是自动驾驶等决策大模型,用大模型来求解问题,越发成为AI产学研的风潮,各大高校以及研究所对于AI人才的投入将越来越多。王者荣耀的游戏场景提供了仿真的实验场,为新技术的快速迁移、落地及产业化充当桥梁,对于AI研究很有意义。
赵鉴也认为,将来的科研成果要走出实验室,应用到产业或者实际任务中,在游戏中的技术验证能提供很大的帮助。在现实中,一个机器人如果因为发生碰撞被损坏,就无法继续实验。在游戏环境中率先实现人工智能算法,是更切实的路径,可以减少在现实场景中所需要的训练时间及成本。
以“教育+竞赛+科研”的共生发展模式推动AI产业生态的建设,成为AI产业发展的三条“新纽带”。
第一条纽带中,“开悟”连接了行业里的人,建立与人才之间的联系,助力产学研生态建设;第二个纽带,连接科研共同体,交融碰撞,助力科研突破;第三条纽带,建立与产业伙伴的连接,助力探寻更多产业应用新场景。第三条建立在前两条基础上,它是远景,也是全行业的期望:让游戏科技推动教育产业升级。
“开悟AI人才培育解决方案”发布
产学研联盟的构建也将进一步加速新应用、新技术的落地,加快创新型人才的培养。开悟平台的研究成果还将与更多行业有机结合,沉淀更多创新型算法,为医疗、制造、无人驾驶、农业、智慧城市等领域带来更深远影响。
目前,开悟平台与西南交大合作的智慧交通项目正处在实验阶段,预计今年下半年进入校内场景测试。
基于这些阶段性成果的展出,可以想象:以开悟平台为代表,腾讯在AI+游戏上的研究,也将成为攻克AI终极研究难题,探索通用人工智能的关键一步。
赵一铮认为,国家十分重视AI人才的培养,预计未来会有更多的高等教育机构开设AI相关专业。而对于AI人才的培育,必须在产学研的协同中实现。另一方面,开悟平台将学生培养与实际企业业务紧密联系起来,既能利用其强大的计算能力帮助人才培养,也能推动企业产品和服务的升级和强化。
据他介绍,在学校每年组织的课程评分和匿名反馈时,企业有经验的工程师的实操课程,评分往往最高。甚至有很多学生说大学生涯帮助最大、影响最大的一门课程,来自于业界导师,“因为他们不仅仅是把培养或者育人的目光仅仅停留在理论和课本上,而是会直接带着同学们参与到企业级的实操项目上去”。对于未来的AI高等教育,这是值得借鉴和更深入推广的合作模式。