2014年にGoogleに買収された英国のAI企業 DeepMindが、想像力を備え行動の結果を理解できるAIの開発に取り組んでいる。

DeepMindが先週投稿した2本の研究論文では、AIがどのように「計画を組み立て」、将来重要となる情報を覚えておくことができるかについて述べられている。

「こうしたエージェントがほかと区別するところは、あらかじめ指定された正確な情報からではなく、ノイズだらけの整理されていない情報から世の中のモデルを学習するという点です」と、DeepMindの研究チームはWired誌に語った。

「想像をベースとする取り組みは、頼るべき選択肢がない新しい状況や、やり直しが効かない結果が起こり、即座に次の判断を迫られた時には、特に役に立つものです」

DeepMindの多くの研究同様、今回もビデオゲームを使ってAIの熟達度が測られている。使われたのは”倉庫番”で、ルールは知らされていない。以下のビデオが示す通り、AIはどうすればゲームをクリアでき、やがてそれをより正確に、早くこなせるかを学習している。

YouTube:Imagination-augmented agent plays Sokoban

「この新しいAIは既存のタイプと比べて、未知のモデルに対するデータ効率やパフォーマンスに優れています」と、DeepMindはいう。

DeepMindは2015年に、Atari社のブロック崩しを学習するDeep Q-learning AIを発表した。開始から120分後にはAIがこのゲームの“エキスパート”になっており、ミスなしで全てのブロックを崩せるようになっていた。

同社は囲碁や、抽象戦略ボードゲームで人間のチャンピオンを多く倒したことで知られるAlphaGoAIでよく知られている。将棋やチェス向けのAIを出すかどうかについては定かではない。

Pocket
LINEで送る