1: ラダームーンサルト(栃木県) [US] 2019/07/17(水) 17:10:14.93 ID:wtKccmt50 BE:886559449-PLT(21000)
ルービックキューブを一瞬で解くことに深層強化学習アルゴリズムが成功

囲碁のトップ棋士に勝利したAI「AlphaGo」は、自らの進化形として生まれた「AlphaGo Zero」に、
誕生からわずか30時間で超えられてしまいました。AlphaGoとAlphaGo Zeroの違いは、AlphaGo Zeroが人間の棋譜を参考にせず、自身による強化学習で鍛錬を重ねたという点にありました。これと同じように、カリフォルニア大学アーバイン校(UCI)が生み出した深層強化学習アルゴリズム「DeepCubeA」は、人間の手助けなく、ルービックキューブをほんの一瞬で解けるようになったそうです。

6色のパネル9枚で構成された六面体の立体パズル・ルービックキューブは、慣れてくると50手程度で解くことができ、最短だと20手を切ることが可能です。

UCIのピエール・バルディ教授らは、このルービックキューブを「DeepCubeA」と呼ばれる深層強化学習アルゴリズムで攻略。事前に解法を与えたり、人間を手助けをしたりすることなく、2日間かけた自己学習の結果、解決率100%、うち60.3%の事例で最短の解き方を得ることに成功しました。解くのにかかる時間は「ほんの一瞬」だとのこと。

うしみつ注:引用此処まで。全文はソース元をご覧ください
https://gigazine.net/news/20190717-rubiks-cube-solve-deepcubea/
no title