AlphaGo

作者: Louise Ward
创建日期: 5 二月 2021
更新日期: 28 六月 2024
Anonim
AlphaGo - The Movie | Full award-winning documentary
视频: AlphaGo - The Movie | Full award-winning documentary

内容

定义-AlphaGo是什么意思?

AlphaGo是一种狭窄的AI,这是由Google DeepMind开发的一种计算机程序,用于玩Go(中国战略棋盘游戏),适用于两个类似于国际象棋的玩家。 AlphaGo是第一个AI程序,该程序能够在没有障碍的全尺寸棋盘上于2015年10月击败职业单人玩家2 dan Fan Fan Hui。然后在2016年3月击败了世界上排名最高的人类玩家之一,即9人丹·李·塞多尔(Lee Sedol),赢得了五场比赛中的四场。


Microsoft Azure和Microsoft Cloud简介在本指南中,您将了解什么是云计算,以及Microsoft Azure如何帮助您从云迁移和运行业务。

技术百科解释了AlphaGo

AlphaGo项目于2014年开始作为测试平台,以了解利用深度学习的Google DeepMinds神经网络算法在Go上的竞争能力。 AlphaGo的算法结合了树搜索和机器学习技术,并经过了人类和其他计算机参与者的广泛培训而得到了增强。它使用蒙特卡罗树搜索,并由使用深度神经网络技术实现的政策和价值网络指导。策略网络经过培训,可以帮助AI预测最有可能获胜的下一步,而价值网络经过培训可以缩小搜索树的范围并确定这些职位的价值,从而估算每个职位的获胜者,而不是一直向下搜索到游戏结束。

AlphaGo首先从人类选手的历史比赛动作中获得养分,利用了大约3,000万步动作的数据库,使其模仿人类比赛。一旦AI达到熟练程度,就可以通过强化学习来改进和学习更多知识,从而使其与自己的实例竞争,从而对AI进行进一步的培训。

2015年10月,分布式计算版本的AlphaGo击败了2项欧洲围棋冠军Fan Hui,这是有史以来第一次计算机程序在Go上击败了职业选手。失败后几个月,范辉就担任DeepMind团队的顾问。 2016年3月,AlphaGo与世界排名最高的选手之一李·塞多尔(Lee Sedol)搭档,获得了9杆的最高水平。赢得了Lees一场比赛的四场比赛,这标志着AI研究的重大突破,因为这意味着DeepMind使用的深度学习和神经网络算法可以用于任何其他目的,因为它不是真正为玩Go而编写的,而是经过教授的怎么玩围棋。这为AI研究开辟了一个全新的世界。