alpha go使用了什么技术？

如题所述

AlphaGo主要使用的技术是专家系统。

Alphago属于人工智能应用领域中的计算机博弈。阿尔法围棋（AlphaGo）是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人，由谷歌（Google）旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。

2017年7月18日，教育部、国家语委在北京发布《中国语言生活状况报告（2017）》，“阿尔法围棋”入选2016年度中国媒体十大新词。

AlphaGo的基本原理：

在具体算法上，AlphaGo用深度卷积神经网络(CNN)来训练价值网络和策略网络。棋盘规模是(19×19)，棋盘每个位置编码48种经验特征。把这些特征输入模型进行训练，经过层层卷积，更多隐含特征会被利用。

基于类似的卷积神经网络结构，AlphaGo先做策略学习（学习如何下子），再做价值学习（学习评估局面）；策略学习也分为两步。第一步是有监督学习，即“打谱”，学习既往的人类棋谱。第二步是强化学习，即“左右互搏”，通过程序的自我博弈来发现能提高胜率的策略。

操作过程

阿尔法围棋（AlphaGo）为了应对围棋的复杂性，结合了监督学习和强化学习的优势。它通过训练形成一个策略网络（policy network），将棋盘上的局势作为输入信息，并对所有可行的落子位置生成一个概率分布。

然后，训练出一个价值网络（value network）对自我对弈进行预测，以 -1（对手的绝对胜利）到1（AlphaGo的绝对胜利）的标准，预测所有可行落子位置的结果。

这两个网络自身都十分强大，而阿尔法围棋将这两种网络整合进基于概率的蒙特卡罗树搜索（MCTS）中，实现了它真正的优势。新版的阿尔法围棋产生大量自我对弈棋局，为下一代版本提供了训练数据，此过程循环往复。

温馨提示：答案为网友推荐，仅供参考

相似回答

大家正在搜

使用alpha alpha怎么用 alpha alpha值 alpha是不透明度双alpha可以结合吗