永发信息网

Alpha"新狗"自学3天胜人千年谷歌要用它来做啥?

答案:1  悬赏:40  手机版
解决时间 2021-04-01 04:13
  • 提问者网友:我没有何以琛的痴心不悔
  • 2021-03-31 23:28
Alpha"新狗"自学3天胜人千年谷歌要用它来做啥?
最佳答案
  • 五星知识达人网友:孤独的牧羊人
  • 2021-04-01 00:16
北京时间10月19日凌晨,谷歌旗下的人工智能公司DeepMind在世界顶级科学杂志Nature杂志上宣布了AlphaGo的新进步,可以在没有人类干预的情况下自我学习,新的AlphaGoZero在自我学习3天之后,就以100比0的成绩战胜了第一代AlphaGo。




AlphaGo zero 图片来自网络
自我学习能力的出现,对于人工智能和机器学习来说,是一个新的突破。“过去人们普遍认为机器学习是基于海量的大数据,但是从AlphaGoZero身上,我们发现算法比数据更重要。”AlphaGo项目的主要负责人戴维·席尔瓦(David Silver)说道。
也由于使用了更多的算法和更少的数据,所以AlphaGoZero只使用了一台计算机器和4个TPU,被它打败的一代AlphaGo则用到多台机器和48个TPU。
当人们惊讶于AlphaGoZero在围棋领域的神级水平时,对于DeepMind团队来说,这才只是刚刚开始,他们的目的是通过培养自主学习的能力,来解决更多其他领域目前无法解决的棘手问题。
从AlphaGo、AlphaGoMaster到AlphaGo Zero
AlphaGo于2015年10月面世,在广为人知的与棋手李世石对弈之前,它已经打败了欧洲围棋冠军樊麾。樊麾接受采访时表示,当时在他看来,一个计算程序要打败职业棋手是不可能的事情。
结果他以0-5输给了AlphaGo,但他也因此加入了DeepMind团队,帮助训练AlphaGo。2016年3月,在他帮助训练下的AlphaGo以4-1的成绩打败了人类顶尖棋手李世石。2017年初,AlphaGo化名为“Master”,在网络上挑战60名人类棋手,保持全胜的成绩。2017年5月,在乌镇的,名为Master的第二代AlphaGo以3-0战胜了目前人类最强棋手柯洁。




AlphaGo对战柯洁 图片来自网络
今年5月的比赛期间,DeepMind的多位高管就已经向记者透露,Master已经实现了自我学习能力,甚至有了自己的“直觉”,“我们发现AlphaGo已经不需要依赖人类训练师了。”戴维·席尔瓦告诉记者。
与柯洁的对弈中,AlphaGo已经能下出很多人类棋手完全无法想象的路数,比赛后柯洁表示,第一代的AlphaGo还能找到破绽,Master已经实现了“从人到神”的飞跃。
而AlphaGoZero在“独立”上更进一步,在训练的过程中,它是自我对弈。从训练图上可以看出,由于一开始并不熟悉围棋,对弈双方的水平都很弱,但是随着时间的推进,在短短3天互相博弈490万局后,越来越强,实现了围棋水平的突破。



(图:AlphaGo训练的72小时图谱)

人类顶尖棋手柯洁被认为是围棋天才,6岁开始学棋,17岁时在世界范围内排名第一,一个人类天才十几年的学习,被AlphaZero用3天时间超越。
但DeepMind团队志不在此,“AlphaGo的意义不在于打败人类,而是领悟知识,解决更多的问题。”戴维·席尔瓦表示。
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯