魔方还原步数最少 魔方还原步数图解( 三 )


比如,DeepCube大量使用一组特定的操作,即aba-1 。就是先执行某个转动a,再执行另外一个转动b,最后把a步骤转回去 。
团队检查了DeepCube处理640个完全打乱的魔方时,发现AI经常使用这样的操作,这样能在移动某些方格的过程中,让其他方格不要受到影响 。具体来说,就是查看每三次相邻的转动,出现频次最高的14种,都是aba-1格式 。比其他格式的出现频率明显要高 。
至于现在嘛,团队可能觉得,自家的AI复原三阶魔方已经百发百中了,于是就开始研究四阶魔方,以及各种奇奇怪怪的魔方 。

魔方还原步数最少 魔方还原步数图解

文章插图
团队可能觉得,自家的AI复原三阶魔方已经百发百中了,于是就开始研究四阶魔方,以及各种奇奇怪怪的魔方 。
另外,走出魔方的世界,他们觉得这种 *** 也可以用来处理其他组合优化问题,比如预测蛋白质的三级结构 。
许多组合优化问题,都可以想成序列决策问题,也就可以用强化学习来解决 。
论文这篇论文已经提交到NIPS,题目是:Solving the Rubik’s Cube Without Human Knowledge
传送门在此:
https://arxiv.org/pdf/1805.07470v1.pdf
OMT有奖 (吗) 竞猜,那个碎掉魔方的机器人选手,来自哪里?
在量子位公众号(ID:QbitAI)对话界面,回复:“魔方”两个字,答案立刻揭晓 。
— 完 —
诚挚招聘
量子位正在招募编辑/采访人员,工作地点在北京中关村 。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字 。
量子位 QbitAI · 头条号签约作者
?'?' ? 追踪AI技术和产品新动态

推荐阅读