两台阿尔法狗对奕会怎样?


两台阿尔法狗对奕会怎样?

文章插图
其实 。你提的问题 。本身就是阿尔法狗深度学习的秘密!
请仔细看上图 。AlphaGo通过自我对弈 。产生一个输赢的结果;然后再以此为基础 。再自我对弈;一直循环往反复 。通过大量的自我对弈棋局 。最终提升预测水平 。也就是围棋水平 。
人类棋手 。穷其一生 。对弈局数最多也只有数万而已 。
但阿尔法狗就不一样了 。通过分布式电脑的顶尖运行速度 。它短时间内就可以产生百万甚至千万的自我对弈局数 。并且随着时间的增长 。它可以持续通过自我对弈提升自己的水平!
所以 。你的问题答案就很明白了:
【两台阿尔法狗对奕会怎样?】两个版本完全一致的阿尔法狗对弈的话 。肯定会有赢有输 。输赢会非常接近!
如果版本不一致的两个阿尔法狗对弈的话 。肯定是后期版本的赢的机率大!这是它深度学习的原理决定的!
一句话:你的两个阿尔法狗对弈的问题 。它其实已经进行了上千万甚至上亿次了!
其他观点:
这个问题就不用如果了 。网上已经放出了50盘两狗互掐的棋局 。直接说结果 。黑棋胜了12盘 。白棋胜了38盘 。从这个统计数据可以看出很多问题 。
两台阿尔法狗对奕会怎样?

文章插图
其一 。白棋胜率远远高于黑棋说明现在的贴目规则并不“科学” 。现在的围棋规则是黑贴7目半 。根据阿尔法狗的互掐测试说明黑棋贴目贴多了 。理论上来讲 。如果可以让两只狗在贴6目半或者5目半的前提下再各下50盘 。黑白胜率基本相同的时候就是相对科学的贴目 。
其二 。中盘胜的盘数是19盘 。另外31盘都下到了最后 。这说明了围棋还是太深奥了 。比如说一盘棋的终局手数是230手左右 。双方水平越高 。就越可能在越早的手数时知道最终的胜负(共识) 。既然阿尔法狗的”互掐“大部分也需要在终局决出胜负 。说明阿尔法狗还远远未到”围棋上帝“的水平 。只能说咱们老祖宗发明的这个围棋太伟大了 。太深奥了 。现在才知道当年日本著名棋手藤泽秀行先生的那句“棋道一百 。我只知七”并非谦言 。
两台阿尔法狗对奕会怎样?

文章插图
其三 。从放出的50盘棋来看 。棋局中已经有很多招数人类已经看不懂 。这里说的人类指的是人类中的顶尖围棋高手 。现在已经有很多顶尖高手在模仿阿尔法狗的下法 。但仅仅是模仿 。也许个别的招法人类有一些理解 。但显然还没有理解透彻 。就像人类所说的定式 。某一个定式有的人知道5种变化 。有的人知道50种变化 。但无论知道多少 。并不妨碍使用 。知道这样下是高招 。但里面蕴含的千万变化还要通过千万盘实战去试着理解 。
其四 。阿尔法狗放出的50盘“左右互搏”将掀起一场围棋革命 。人类对围棋的理解也许能从原来的7%有一个质的飞跃 。
其他观点:
这是个很有意思的问题 。但其实已经发生过了 。
10月19日凌晨某国际期刊指出 。谷歌新智能“阿尔法元”:在仅仅知道围棋规则的情况下 。从0开始自学,不看人类棋谱 。仅仅3天时间 。通过自己和自己下棋的方式 。进行了490万盘博弈 。
两台阿尔法狗对奕会怎样?

文章插图
然后 。这个本名叫阿尔法元的机器与“前辈”---阿尔法狗进行了50盘较量 。并以38:12的战绩获胜 。而“前辈”阿尔法狗其实是在通过几个月时间 。学习了大量人类棋谱之后 。才战胜了人类围棋冠军 。
也就是说 。阿尔法元的完全是依靠自己的的算力 。根据规则进行大量运算 。并且学习自己左右互搏的经验从而取得了胜利 。
不过 。很多围棋高手在看过棋谱之后 。发现自己记不住 。也看不懂 。而所有人类高手都学过棋谱 。这说明人工智能完全按照自己的方法 。通过算力想出来的方法 。基本都没有人类棋谱的样子 。
要知道 。围棋高手超越普通人的地方 。是他们可以把围棋看成一个一个具体的模块 。而我们普通人眼里 。则是一颗颗棋子 。既然高手都看不懂阿尔法元的套路 。说明它的下的棋谱 。没有历史渊源可寻 。不是可以被人类高手高手辨识的围棋模块 。
这再一次从侧面说明 。这个阿尔法元其实有着被阿尔法狗更强大的算力 。以至于 。它根本就不需要看棋谱学习 。但有关专家表示 。阿尔法元其实并没有产生人类思维 。

推荐阅读