アルファ碁ゼロとは?
みなさん、まず初めにアルファ碁(AlphaGo)はご存知だろうか?
グーグル・ディープマインド(Google DeepMind)社によってつくられたコンピュータ囲碁プログラムである。
2017年5月に世界最強とされる中国の柯潔(かけつ)棋士に勝利した。それゆえに「世界最強の棋士」という異名を持つ。
しかし、今回そんな従来のアルファ碁に100戦全勝した、アルファ碁ゼロなるものが登場したのである。
「囲碁勝てたからって何になるのよお」「カロリーも糖質もAIも何でもゼロって言えばいいってもんじゃないのよ」などと思ってしまったそこのあなた。
名前にゼロがついただけだと侮ってはいけない。いったい今回のアルファ碁ゼロが今までとは何が違うのか、詳しく解説していこう。
自分で進化したAI棋士
今回筆者が最も伝えたいのは、従来のアルファ碁とアルファ碁ゼロの違いである。
まず、従来のアルファ碁もアルファ碁ゼロも人間により囲碁のルールを教わった。
ルールを知らなければ何も始まらない。ここまでは全く同じ。だが、ここからが大きく違うのだ。
従来のアルファ碁にはプロ棋士の膨大な対局データも読み込ませた。それをベースに勝率の最も高い手を計算し、人間のプロ棋士に勝つまでの能力を身に付けたのだった。
一方で、新しいAI棋士であるアルファ碁ゼロは人間の対局データなどを一切学ばなかった。ルールのみを教え、AI同士の対局を繰り返すことで能力を高めた。
そして、なんと実験開始からわずか3日後、従来のアルファ碁に100戦全勝した。
なんてこった!つまり、人間の知識や経験を一切与えないで能力を高めたほうが強くなったのである。
まるでSF映画の世界ではないか!!!
AIが自分たちで学習して、自分たちだけで強くなった。むしろ人間が知恵を吹き込まないほうが良かったということが証明されたのだ。
だが、人間が長年の囲碁の歴史の中で考案した、最善とされる打ち方である「定石」もアルファ碁ゼロは独自に発見したそう。このことは、人間が今まで「定石」としてきたものは間違ってなかったと言うことも証明してくれたと言えるだろう。
悲しいかな、もう人間とAIが囲碁で力比べをする時代は終わってしまった。囲碁の世界は着実に変わってしまい、AIのなかで最強を決める次元に突入している。
今後に期待
アルファ碁ゼロの手法の中には、プロ棋士が未だ理解できない手も含まれているらしい。
アルファ碁ゼロに囲碁のルールを教えた人間が、逆に勝つための一手を教えてもらうとは、なんとも不思議な話である。
この開発成果は、また新たな研究に応用されるそう。AIによって私たちの世界にどんな変化がもたらされるのか、少し怖さもあるが筆者は今後が楽しみだ。