对于那些认为人工(gōng)智能是威胁的(de)人来说,可(kě)能不(bú)太喜欢 DeepMind 的(de)最新研究成果。这家(jiā)隶(lì)属于(yú) Alphabet 的人工智(zhì)能部门提出了名为 MuZero 的(de)新算法,能够(gòu)让机器(qì)在不了解规则的情况下成(chéng)功击败人(rén)类选手(shǒu)。这绝对是(shì)人工(gōng)智能(néng)领域的(de)一个惊人发展,因为(wéi)该(gāi)算法能够让人工智能更(gèng)好(hǎo)地的应对现实生活中的场景,而且(qiě)不需要提供任何(hé)特定的算法。
DeepMind 在探索人工智能的道路上从(cóng)未停止脚步(bù)。在(zài) AlphaGo 学会围棋并成功(gōng)击败职业围(wéi)棋手之(zhī)后(hòu),DeepMind 又推出了 AlphaGo Zero,通(tōng)过观(guān)察人和人(rén)之间的真(zhēn)实比赛,然后让两台计算机一(yī)同来下棋。
随(suí)后,该团队再次推出了 AlphaZero,只是在告(gào)知游戏规则的情况下,实现了对(duì)围棋、将棋(qí)和国际象(xiàng)棋的熟(shú)练掌握。而现在该团队推(tuī)出的 MuZero,并没有(yǒu)告(gào)知任(rèn)何的棋类运行规则,让它(tā)自己通过观察来掌握围棋(qí)、国际象棋(qí)、将(jiāng)棋和 Atari 游戏。
MuZero 在没有传授规则的情况(kuàng)下可以自己学(xué)习(xí),制定相应的计划并取得胜利(lì)。MuZero 可以在雅达利(lì)游戏中做(zuò)同样(yàng)的事情。新的人工智能在学习了规则之后(hòu),可以变得和以前的版本一样好(hǎo),甚至比以前(qián)的版本更好。
这个项目的目标是提供一个单一的算法,可以让(ràng)AI在不知(zhī)道该方案的规(guī)则的情况下想(xiǎng)出下一步(bù)行动。对于象棋和围棋(qí)这(zhè)样的游戏来说,这可能说起来容(róng)易做(zuò)起来难,因为在这些(xiē)游(yóu)戏(xì)中,有一套预定义的动作可以让(ràng)你获得胜(shèng)利或失败。但在大多数现实(shí)世界的情况下,如(rú)果没有(yǒu)获得复杂的算法,人(rén)工智能可(kě)能难以(yǐ)驾(jià)驭更(gèng)多(duō)的种类,而这种算法基本上(shàng)可以让它思考。
但事实上 MuZero 并不会(huì)自己思(sī)考,更没有(yǒu)达(dá)到科幻(huàn)小说/电影中可怕的人工智能。然而,DeepMind确实达到了一个重要的(de)里程碑,如果它的(de)算法(fǎ)允许计算(suàn)机在它不知(zhī)道所有规则的模拟(nǐ)中提出一个胜利的解决方案。
Engadget解释说,MuZero在做决定时会考虑三件(jiàn)事。首先,它会考虑上一次行(háng)动(dòng)的结果、当(dāng)前所处的位置以及下一(yī)次行(háng)动的最(zuì)佳方案。DeepMind发(fā)现,MuZero与之(zhī)前的AIs相(xiàng)匹配。而(ér)且(qiě),它的时间越(yuè)多,它提供的(de)解决方案就越好。即使加入了(le)时间限制,比如在行动前限(xiàn)制(zhì)吃(chī)豆人女(nǚ)士(shì)的模拟次数,MuZero也取得(dé)了不错的效果。