Dota2如何变相推动了ChatGPT的诞生

今天分享一篇短文。

最近,你可能听过太多人聊ChatGPT了。AI生成的“新技能”正在以每周甚至每天的速度进步。有人觉得OpenAI创造的大语言模型,是互联网之后最令人兴奋的科技跳板,也有国家、机构开始限制AI训练,封杀ChatGPT。争论肯定还会继续。

那不如,我们试着回到故事的起点?如果我说,游戏玩家其实是最早听说“OpenAI”这个机构名字的大众群体,你是否能回想起什么?前不久,在英伟达组织的一次线上会议上,OpenAI联合创始人就聊起了团队做出的第一个大项目,打Dota2的AI。

OpenAI在2017年到2019年间,多次举办了Dota2 AI与职业选手的对局,当时被冠以“人机大战”的噱头,BB姬也写过文章介绍。研究游戏看似是他们走的一条弯路,但也在给OpenAI打响名声的同时,增强了团队对AI训练模型的理解,并变相推动了后续ChatGPT的诞生。

事实上,即便训练出了(在一定限制下)能够击败电竞世界冠军的AI,在很长一段时间里,OpenAI都被许多人认为是意义不明的项目,“打游戏这么强有什么用?”。但如今我们才明白过来,通过ChatGPT名利双收的OpenAI已经离自己的不朽盾越来越近。

本文转载自 | 游戏葡萄

原作者 | 王丹

近日,英伟达GTC线上大会发起了一场特别活动——英伟达CEO黄仁勋与OpenAI联合创始人兼首席科学家Ilya Sutskever进行了一次“炉边谈话”。两人就OpenAI旗下产品ChatGPT系列,以及OpenAI公司本身的发展进行了回顾和探讨。

Ilya在谈话中提到,在OpenAI及其产品的发展历程中,有2个好点子功不可没——第一个是,通过压缩训练数据让AI进行“无监督学习”;第二个是,让AI进行强化学习。在介绍强化学习部分时,Ilya特地提到了《DOTA2》——训练出能与职业选手对抗的《DOTA2》AI,这是他们在OpenAI中完成的第一个真正的大型项目。

在2017年的《DOTA2》国际邀请赛(TI7)上,OpenAI首次与《DOTA2》玩家见面。当时的OpenAI还无法进行5V5对战,只可进行中路单挑。在表演赛环节,主办方请来了TI1冠军队选手Dendi,他使用英雄影魔与OpenAI进行中路单挑。OpenAI展现了熟练的卡兵技巧,随后仅用4分40秒就2:0击败了Dendi。

比赛期间,OpenAI官方在YouTube上发布视频,解释了为何团队选择用《DOTA2》来训练AI——《DOTA2》机制较为复杂且竞技性较强,AI在游玩中需要不断学习新的技能、新的玩法,才能达到和职业玩家相当的水平,这使《DOTA2》成为了很好的AI自我训练道具。

在此之后,OpenAI研发出了《DOTA2》5V5对战AI——OpenAI Five。5V5对AI之间的合作、策略规划提出了更高要求。在实际对战中,OpenAI Five的合作表现确实不如职业选手——2018年8月TI8,职业战队paiN在表演赛上对战OpenAI Five,最终取胜;在TI8的第二场表演赛上,BurNing徐志雷、骆非池iG_430等5位国内前职业选手组成小队,对战OpenAI Five,也同样取胜。

OpenAI Five在2018年的战绩并不好看,但它的成长速度超出了许多玩家的想象——2019年4月,OpenAI Five与TI8冠军战队OG进行BO3对战,官方对这次比赛进行了直播。

最终OpenAI Five以2:0的比分拿下了BO3胜利。期间还多次表演了诱敌深入、丝血逃命的“骚操作”。

比赛之后,OpenAI官方宣布在2019年4月18-21日举办Open Five擂台赛,期间全球玩家可自行组队挑战OpenAI Five。根据官方最终在推特上公布的数据来看,OpenAI赢得了7215场比赛,输掉了42场,胜率高达99.4%。

谈到OpenAI在《DOTA2》上的尝试,黄仁勋表示,当时OpenAI看似在走弯路,但现在回顾却发现正是这些弯路导致了ChatGPT的产生。Ilya表示认同——从某一方面来说,通过《DOTA2》,OpenAI的学习模式从“强化学习”转变为了“基于人类反馈的强化学习(RLHF)”,这为后来的ChatGPT技术提供了借鉴。

当然,《DOTA2》只是OpenAI的突破性尝试之一:在早期同行专注于神经网络的深度时,OpenAI已经在兼顾考虑神经网络的规模;团队曾运用英伟达GPU和ImageNet来训练神经网络模型,而用黄仁勋的话来说,其训练结果“震惊了世界”。

据llya介绍,今年3月推出的GPT-4采用多模态模型,不仅能够更好地理解文本,也能从图像中获取和学习信息,GPT-4也因此具有更强的总结推断能力。但llya也坦言——OpenAI还没有充分挖掘出AI的潜力,AI领域在未来还会持续进步。

回顾过去,《DOAT2》并不是唯一一个推动科技及研发进展的游戏。最被玩家熟知的,可能还是2005年的“堕落之血事件”——因为暴雪设计上的疏漏,一种传染性极强的debuff在《魔兽世界》各大主城传播,造成大量玩家角色伤亡。“堕落之血事件”一度得到了公共卫生学界的关注,很多研究者将“堕落之血事件”作为流行病学的“虚拟案例”加以研究,还有人撰写了相关论文并刊发在医学期刊《柳叶刀·传染病》上。

图源YouTube@Half as Interesting

除了这些成果较为明显的案例,游戏行业的发展本身就对科技有着不小的推进作用。今年2月,新华社旗下的每日电讯发文《别忽视游戏行业的科技价值》表示,游戏科技近年来正在芯片、终端、工业、建筑等实体产业领域实现价值外溢,释放更多效能。此外,文章认为,游戏产业汇聚了大量高水平科技人才,并且其发展顺应消费者需求,兼具市场与人才的“先天优势”,将为更多科技创新提供基础环境。

© 版权声明
THE END
喜欢就支持以下吧
点赞0
分享
评论 抢沙发

请登录后发表评论