AphaGo0能获胜的原因是什么? 2)AhphaGo的相关技术有哪些?

如题所述

推荐答案 2022-05-17

AlphaGo中就_取了两套神经网络系统。
走棋网络，快速走子，估值网络，蒙特卡罗树搜索。一个神经网络基于当前的状态给出下一个动作，一个神经网络用来评估当前的状态是否对我方有利，使用神经网络配合搜索树来提供好的下棋行为，将这些好的行为作为训练数据反过来训练神经网络，这样一来一回使用强化学习的方法不断地训练，我们的神经网络就能不断地提升自己下棋的能力，这就是AlphaGo能战胜人类的主要原因。走棋网络（Policy Network），给定当前局面，预测/采样下一步的走棋。快速走子（Fast rollout），目标和1一样，但在适当牺牲走棋质量的条件下，速度要比1快1000倍。估值网络（Value Network），给定当前局面，估计是白胜还是黑胜。蒙特卡罗树搜索（Monte Carlo Tree Search，MCTS)，把以上这三个部分连起来，形成一个完整的系统。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://33.wendadaohang.com/zd/RdB4cR0WPdR5PW555PP.html

其他回答

第1个回答 2023-06-13

阿尔法go把两个神经网络结合起来（决策网络和数值网络），就可以大致预估出当前的情况
2. AlphaGo的相关技术：走棋网络（Policy Network），给定当前局面，预测/采样下一步的走棋。快速走子（Fast rollout），目标和1一样，但在适当牺牲走棋质量的条件下，速度要比1快1000倍。估值网络（Value Network），给定当前局面，估计是白胜还是黑胜。

相似回答

1, 什么是人工智能?视频时间 00:35

中国的人工智能现在发展到什么阶段了?答：弱人工智能(ANI)：弱人工智能是擅长于处理某一单个方面的人工智能。比如Alfago只能下象棋，苹果Siri目前只能作为你的语音助手。特斯拉的无人驾驶系统里也包含无数的弱人工智能，不要否认，我们已经进入人工智能的世界中，只是现在level还比较低。甚至在弱人工智能中都属于比较低级的阶段强人工智能(AGI)：...

围棋的发展历史是什么样的?答：围棋被称为是世界上最复杂的棋盘游戏，原因就在于它的变化多端。围棋的棋盘，很多人都见过，纵横各十九条，整个棋盘上也就是三百六十一个交叉点。棋盘的盘面上会标有九个小圆点，最中间的称为“天元”，因为围棋中有一句术语“金角银边草肚皮”，“天元”一般不认为是第一个应该落子的地方，毕竟棋盘就...

大家正在搜

你觉得蚊子获胜的原因是什么蚊子获胜的原因是什么拔河获胜的原因是什么次优技术获胜局面的出现有几种原因获胜的货是什么意思二战最终获胜的原因林肯获胜的原因特朗普获胜的原因特朗普大选获胜的原因