首页 > 业界新闻 >>  正文

AI游戏击败人类 难道真有了“人的意识”?

发稿时间:2018-07-12 08:42:00 来源: 扬子晚报 中国青年网

  两年前谷歌旗下人工智能部门DeepMind开发的人工智能击败了世界围棋冠军而一举成名。现在,DeepMind的另一个项目已经学会了如何玩多人游戏《雷神之锤》。而就在上月底,由马斯克联合创立的人工智能非营利研究机构OpenAI宣布,其开发的AI(人工智能)组队在5对5对战中战胜了游戏Dota2的顶尖业余玩家。这被认为是继阿尔法狗大战柯洁之后的又一里程碑事件。

  组队赢了Dota 2

  6月25日,著名非营利机构OpenAI宣布:其研究的OpenAI Five能像人类一样“组队”,首次在5对5对战中战胜Dota 2人类玩家,平均天梯分数超4200分(超过近90%玩家)。比尔·盖茨评价说:“这是一个了不起的成就,因为它们的胜利需要团队合作和协作,这是人工智能前进道路上的一大里程碑。”

  会玩《雷神之锤》

  7月3日,DeepMind表示开发了创新和强化学习技术,使AI系统能在《雷神之锤III竞技场》的游戏中达到人类的游戏水平。研究者们举行了竞赛,参赛队伍有3种形式:人类玩家组队、机器人组队、机器人和人类玩家组队。最终全员为机器人的小队胜率达到74%(老手玩家胜率约为52%,普通玩家为43%)。

  怎么赢的?AI一日,人间180年

  学得迅速

  设计者让OpenAI Five通过自我对抗的方式从随机权重开始学习,随着训练的进行,英雄从漫无目的地闲逛到出现战斗的“意识”。几天之后,AI的策略就非常接近人类了。据报道,AI的训练量级非常大,每天都能完成人类玩家180年的练习量。

  算得飞快

  OpenAI Five使用在256个GPU和128000个CPU内核上运行的扩展版近端策略优化进行训练。OpenAI每4帧评估一次局势,并产生2万个决策,这样的循环每场游戏平均会进行2万次。OpenAI平均每分钟可进行150-170次操作,平均反应时间为80毫秒。

  独特风格

  在游戏玩法上,OpenAI Five还形成了一些“风格”和独特策略,比如经常来牺牲自己的优势路以压制敌人的优势路,迫使战斗转移到对手更难防御的一边;AI英雄还会自我牺牲,把人类玩家引诱出高地,确保团队其他成员能推塔成功。

  团队精神

  OpenAI Five的英雄之间并没有具体的通信渠道,它们通过被研究人员称为“团队精神”的超参数控制团队合作。设计者表示:“我们能够从比赛中感受到,AI算法间的协作意图似乎是一种非常自然的本能表现。当用一位人类玩家替换掉5位AI玩家中的一位,人类玩家也表示能够体会到AI队友对他的支援。”

责任编辑:翊然
加载更多新闻
热门排行
热 图