Alpha＂新狗＂自学3天胜人千年谷歌要用它来做啥？

答案:1 悬赏:40 手机版

解决时间 2021-04-01 04:13

提问者网友：我没有何以琛的痴心不悔
2021-03-31 23:28

最佳答案

五星知识达人网友：孤独的牧羊人
2021-04-01 00:16

北京时间10月19日凌晨，谷歌旗下的人工智能公司DeepMind在世界顶级科学杂志Nature杂志上宣布了AlphaGo的新进步，可以在没有人类干预的情况下自我学习，新的AlphaGoZero在自我学习3天之后，就以100比0的成绩战胜了第一代AlphaGo。

AlphaGo zero 图片来自网络
自我学习能力的出现，对于人工智能和机器学习来说，是一个新的突破。“过去人们普遍认为机器学习是基于海量的大数据，但是从AlphaGoZero身上，我们发现算法比数据更重要。”AlphaGo项目的主要负责人戴维·席尔瓦(David Silver)说道。
也由于使用了更多的算法和更少的数据，所以AlphaGoZero只使用了一台计算机器和4个TPU，被它打败的一代AlphaGo则用到多台机器和48个TPU。
当人们惊讶于AlphaGoZero在围棋领域的神级水平时，对于DeepMind团队来说，这才只是刚刚开始，他们的目的是通过培养自主学习的能力，来解决更多其他领域目前无法解决的棘手问题。
从AlphaGo、AlphaGoMaster到AlphaGo Zero
AlphaGo于2015年10月面世，在广为人知的与棋手李世石对弈之前，它已经打败了欧洲围棋冠军樊麾。樊麾接受采访时表示，当时在他看来，一个计算程序要打败职业棋手是不可能的事情。
结果他以0-5输给了AlphaGo，但他也因此加入了DeepMind团队，帮助训练AlphaGo。2016年3月，在他帮助训练下的AlphaGo以4-1的成绩打败了人类顶尖棋手李世石。2017年初，AlphaGo化名为“Master”，在网络上挑战60名人类棋手，保持全胜的成绩。2017年5月，在乌镇的，名为Master的第二代AlphaGo以3-0战胜了目前人类最强棋手柯洁。

AlphaGo对战柯洁图片来自网络
今年5月的比赛期间，DeepMind的多位高管就已经向记者透露，Master已经实现了自我学习能力，甚至有了自己的“直觉”，“我们发现AlphaGo已经不需要依赖人类训练师了。”戴维·席尔瓦告诉记者。
与柯洁的对弈中，AlphaGo已经能下出很多人类棋手完全无法想象的路数，比赛后柯洁表示，第一代的AlphaGo还能找到破绽，Master已经实现了“从人到神”的飞跃。
而AlphaGoZero在“独立”上更进一步，在训练的过程中，它是自我对弈。从训练图上可以看出，由于一开始并不熟悉围棋，对弈双方的水平都很弱，但是随着时间的推进，在短短3天互相博弈490万局后，越来越强，实现了围棋水平的突破。

(图：AlphaGo训练的72小时图谱)

人类顶尖棋手柯洁被认为是围棋天才，6岁开始学棋，17岁时在世界范围内排名第一，一个人类天才十几年的学习，被AlphaZero用3天时间超越。
但DeepMind团队志不在此，“AlphaGo的意义不在于打败人类，而是领悟知识，解决更多的问题。”戴维·席尔瓦表示。

我要举报

如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息，可以点下面链接进行举报！

点此我要举报以上问答信息