两台阿尔法狗对奕会怎样？ _经验知识

文章插图
其实。你提的问题。本身就是阿尔法狗深度学习的秘密！
请仔细看上图。AlphaGo通过自我对弈。产生一个输赢的结果；然后再以此为基础。再自我对弈；一直循环往反复。通过大量的自我对弈棋局。最终提升预测水平。也就是围棋水平。
人类棋手。穷其一生。对弈局数最多也只有数万而已。
但阿尔法狗就不一样了。通过分布式电脑的顶尖运行速度。它短时间内就可以产生百万甚至千万的自我对弈局数。并且随着时间的增长。它可以持续通过自我对弈提升自己的水平！
所以。你的问题答案就很明白了：
【两台阿尔法狗对奕会怎样？】两个版本完全一致的阿尔法狗对弈的话。肯定会有赢有输。输赢会非常接近！
如果版本不一致的两个阿尔法狗对弈的话。肯定是后期版本的赢的机率大！这是它深度学习的原理决定的！
一句话：你的两个阿尔法狗对弈的问题。它其实已经进行了上千万甚至上亿次了！
其他观点：
这个问题就不用如果了。网上已经放出了50盘两狗互掐的棋局。直接说结果。黑棋胜了12盘。白棋胜了38盘。从这个统计数据可以看出很多问题。

文章插图
其一。白棋胜率远远高于黑棋说明现在的贴目规则并不“科学” 。现在的围棋规则是黑贴7目半。根据阿尔法狗的互掐测试说明黑棋贴目贴多了。理论上来讲。如果可以让两只狗在贴6目半或者5目半的前提下再各下50盘。黑白胜率基本相同的时候就是相对科学的贴目。
其二。中盘胜的盘数是19盘。另外31盘都下到了最后。这说明了围棋还是太深奥了。比如说一盘棋的终局手数是230手左右。双方水平越高。就越可能在越早的手数时知道最终的胜负（共识）。既然阿尔法狗的”互掐“大部分也需要在终局决出胜负。说明阿尔法狗还远远未到”围棋上帝“的水平。只能说咱们老祖宗发明的这个围棋太伟大了。太深奥了。现在才知道当年日本著名棋手藤泽秀行先生的那句“棋道一百。我只知七”并非谦言。

文章插图
其三。从放出的50盘棋来看。棋局中已经有很多招数人类已经看不懂。这里说的人类指的是人类中的顶尖围棋高手。现在已经有很多顶尖高手在模仿阿尔法狗的下法。但仅仅是模仿。也许个别的招法人类有一些理解。但显然还没有理解透彻。就像人类所说的定式。某一个定式有的人知道5种变化。有的人知道50种变化。但无论知道多少。并不妨碍使用。知道这样下是高招。但里面蕴含的千万变化还要通过千万盘实战去试着理解。
其四。阿尔法狗放出的50盘“左右互搏”将掀起一场围棋革命。人类对围棋的理解也许能从原来的7%有一个质的飞跃。
其他观点：
这是个很有意思的问题。但其实已经发生过了。
10月19日凌晨某国际期刊指出。谷歌新智能“阿尔法元”：在仅仅知道围棋规则的情况下。从0开始自学,不看人类棋谱。仅仅3天时间。通过自己和自己下棋的方式。进行了490万盘博弈。

文章插图
然后。这个本名叫阿尔法元的机器与“前辈”---阿尔法狗进行了50盘较量。并以38:12的战绩获胜。而“前辈”阿尔法狗其实是在通过几个月时间。学习了大量人类棋谱之后。才战胜了人类围棋冠军。
也就是说。阿尔法元的完全是依靠自己的的算力。根据规则进行大量运算。并且学习自己左右互搏的经验从而取得了胜利。
不过。很多围棋高手在看过棋谱之后。发现自己记不住。也看不懂。而所有人类高手都学过棋谱。这说明人工智能完全按照自己的方法。通过算力想出来的方法。基本都没有人类棋谱的样子。
要知道。围棋高手超越普通人的地方。是他们可以把围棋看成一个一个具体的模块。而我们普通人眼里。则是一颗颗棋子。既然高手都看不懂阿尔法元的套路。说明它的下的棋谱。没有历史渊源可寻。不是可以被人类高手高手辨识的围棋模块。
这再一次从侧面说明。这个阿尔法元其实有着被阿尔法狗更强大的算力。以至于。它根本就不需要看棋谱学习。但有关专家表示。阿尔法元其实并没有产生人类思维。