阿尔法狗与阿尔法zero的区别

如题所述

学习方式不同;目标函数不同等。
学习方式不同:阿尔法狗是通过模仿人类棋手的招数来进行学习,而阿尔法zero则是通过自我对弈来学习下棋。
目标函数不同:阿尔法狗是在假设结果为赢/输二元的情况下,对获胜概率进行估计和优化。而阿尔法zero则会考虑平局或其他潜在结果,对更广泛的可能性进行评估和优化。
温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜