今年7月,2021世界人工智能大会在上海举行,腾讯的“王者绝悟”AI也现身展会现场,并与人类玩家进行《王者荣耀》对战。最终“王者绝悟”AI胜利,在电竞领域,AI已到达人类高手水平。
人工智能是国家的重大战略,是新一轮科技革命和产业变革的重要驱动力量,正渗透入每个领域。算法、数据、算力、场景,是AI研究的四大要素。然而,面对算法测试困难、场景及数据稀缺、算力昂贵等问题,并非所有环境都适宜研究AI的自对弈学习。《王者荣耀》无疑提供了一个良好的实验土壤,自2017年诞生以来,“王者绝悟”AI经过千锤百炼不断学习,已经完成了数次进化。
2021年9月1日,第二届 “腾讯开悟多智能体强化学习大赛”正式开赛,来自清华北大等20余所国内外顶尖高校的师生团队将借助《王者荣耀》开展AI研究的竞争。王者荣耀聚焦于游戏AI领域的科技发展,与国内外重点高校及国家重点实验室不断产出对产业有价值的科研成果。人工智能在国内的不断发展,让《王者荣耀》也更加未来可期。
“绝悟”:通用型AI的新起点
在《王者荣耀》中,玩家面临大量实时战略协作任务,规划、跑图、攻击、防御、连招,争夺资源等,而为了达到更高的竞技水平,AI同样需要解锁这些技能。
游戏环境中的多智能体、多变的状态动作、复杂的空间环境等元素向 AI 系统提出了极大的挑战。腾讯所研发的“绝悟”为策略协作型AI,追求掌握实时感知、分析、理解、推理、决策能力,以便在更多变、复杂的真实环境中解决问题,即拥有更通用的能力。
“王者绝悟”作为“绝悟”在《王者荣耀》中的应用,表现的十分优异,在视野和操作反应公平的前提下,多次击败职业选手组成的队伍;而在与顶级业余玩家的竞技中,则实现了99.81%的胜率。
从自己与自己对战开始,“王者绝悟”并不需要人类数据,便可逐步掌握《王者荣耀》,甚至探索出超越常规的创新策略,同时也将自己所学反馈于游戏,用于辅助优化游戏设计。
经过渐进式学习,2020年11月,王者荣耀和腾讯AI Lab共同宣布“王者绝悟”AI推出升级版本——“王者绝悟”完全体,全面解锁英雄池,让AI 掌握所有英雄的所有技能,100 +英雄全覆盖,以及在Ban/Pick环节派出最优英雄组合策略。
2020年12 月 30 日,腾讯AI Lab研发的绝悟We Kick人工智能球队,摘得首届谷歌足球Kaggle竞赛冠军。与5V5团队竞技类型游戏相比,足球竞技不尽相同,但绝悟WeKick版本的整体设计,正是由解禁英雄池后的“王者绝悟”完全体迁移、调整得来。在复杂足球竞技场景中夺冠,也验证了绝悟AI的通用性与深度强化学习能力,如“王者绝悟”一般的策略协作型AI不断向通用型AI挺进。
《王者荣耀》:通用人工智能的实验场
从简单的Atari、扑克游戏再到需要更复杂策略和操作的即时战略游戏、多人在线战术竞技游戏,高复杂度、高挑战性、强协作性环境的游戏场景,为AI的训练提供了理想的环境。
在《王者荣耀》对局中,玩家的动作状态空间高达10的20000次方,远大于围棋及其他简单游戏,甚至超过整个宇宙的原子总数(10的80次方)。
AI+游戏的研究成果可以在短期内给游戏、电竞产业带来直接推动。但从长期来看,游戏逐渐成为人工智能行业的生态催化剂,四川大学计算机学院院长吕建成曾在STAC 科创联合大会上指出,AI+游戏已经超越了娱乐范畴,可以解决其他行业领域的问题。
虽然AI+游戏的落地可应用场景,学术界还在不断研究,但广泛的共识是,在交通、医疗、航天等重点领域AI都大有可为。
更为重要是的,3年来,“王者绝悟”AI飞速成长,已得到了学术界认可,相关论文已先后被AAAI、NeurIPS等AI顶级会议收录。
与人工智能高校科研“开黑”
对于高校而言,AI研究的挑战十分严峻:目前高校研究普遍面临着数据量较少、数据的多样性不足、数据质量参差不齐等问题;同时,随着高校强化学习算法研究的不断深入,项目对计算资源的需求也水涨船高。而除了机器资源本身,也缺乏容易上手的AI开放实验平台。
为进一步打通产学研环节,2020年,腾讯AI Lab携手《王者荣耀》联合建设“开悟”训练平台。平台为科研人员提供技术与资源支持,保证学界在人工智能研究训练时所需要的大规模运算。
王者荣耀执行制作人、腾讯天美L1总经理黄蓝枭表示:“我们开放了《王者荣耀》的核心机制,提供标准接口、核心算法、脱敏的测试数据、评估工具和计算集群等,给高校老师和同学们进行多智能体的机器学习算法研究、学习成果交流、对算法成果反复迭代升级。同时,也期待这些研究成果,能够落地到其他产业环境中。”
2021年9月1日,第二届 “腾讯开悟多智能体强化学习大赛”由腾讯王者荣耀、腾讯AI Lab 、腾讯高校合作、腾讯游戏学院等共同发起,由腾讯云计算提供底层资源支持。
依然是选择面向高校的邀请赛制,但这一次,腾讯进一步扩大了赛事规模,20余所国内外知名高校受邀参赛。为了让参赛者能更加聚焦于AI开发本身,本届赛事更注重轻量化和易用化,在保证赛题研究价值的同时,让游戏规则和研发操作更容易理解和上手,降低高校学生的研究门槛。
在易用性上,开悟对平台操作进行了多项优化,帮助使用者更快上手,更高效地开发。具体包括:进一步完善说明文档,帮助参赛者快速接入平台;开放标准化环境接口代码,允许参赛者在本地环境确认AI效果并进行调试;提升训练效率,大幅缩短模型训练时间等。
作为国内领先的公有云平台,腾讯云在通用CPU和异构GPU丰富的实例配置与规格,可以满足不同业务算力需求,尤其是在AI训练与推理场景下。
在轻量化上,降低参赛者学习游戏规则及进行基础工作的成本,更聚焦于算法开发工作。具体包括:统一开发完备的环境信息,参赛者不需陷于特征工程;开放基准算法,让参赛者“站在巨人的肩膀上”快速迭代等。
在算法框架和组件层面,腾讯太极机器学习平台为开悟平台提供机器学习/深度学习等核心加速组件,结合腾讯内部业务的沉淀,经过了万亿级的数据训练和流量访问,为参赛者提供更有力的支持。
AI+游戏打通的是虚拟世界与现实世界之间的藩篱。腾讯在人工智能领域不断拓展。正如《王者荣耀》中,玩家通关王者绝悟挑战后所获得的称号“智极·绝悟”一般,腾讯正引领着通用AI技术不断进化,登峰“智极”。