「藤井 聡太」とは何ものか(5)

「機械学習」に「強化学習」による急速な「AI」の進歩

「AI」がプロ棋士に匹敵するか、もしくはそれを凌いでいくためには、「AI」がプロ棋士に匹敵するだけの「大局観」を身につける必要がありました。
しかしながら、それはなかなかに困難な道筋であって、多くのプログラマは優劣を判断するための評価関数を次々と編み出していったのですが、その棋力はアマチュア高段者レベルをこえることが難しい時期が続きました。
つまりは、私レベルの棋力であっても「勝ったり負けたり」という状態でしたから、プロ棋士の牙城を脅かすようなレベルに到達するのはまだまだ先のことだと思われていました。

ところが、この困難な課題に「機械学習」という手法でブレークスルーを開いたのが「Bonanza」でした。
この「機械学習」とは、局面の優劣を判断する評価関数をプログラマが作るのではなくて、「AI(Bonanza)」自身に生成させるという発想でした。

「Bonanza」は既に存在しているプロ棋士の膨大な棋譜をデータとして取り込み、それを元に自分自身で優劣を判断する関数をつくり出していくという「機械学習」の手法を取り入れたのです。
もちろん、「機械学習」という手法は既に存在していたのですが、それを将棋の「AI」に取り入れる事にはじめて成功したのが「Bonanza」だったわけです。

この「Bonanza」は登場した時点で既にとんでもなく強くて(^^;、私のようなアマチュアレベルでは全く歯が立たない存在でした。

雰囲気としては想像もしないような形で「桂馬」がぽんぽん跳んできて、あっという間に攻め潰されるという感じでした。
そこで、何度も「待った」をしながら(^^;、間違ったと思う場面に戻して別の指し手を選択し直す事で何とか優勢な場面に持ち込むと、今度は一転して受けにまわるのです。
驚かされたのは、その「受け」がきわめて強靱であり、その強靱な受けに対してぐずぐずしている間にあっという間に逆転されてしまうのです。

「Bonanza」は登場した時点でアマチュアのレベルよりはプロのレベルに近い「AI」だったのです。

「Bonanza」には歯が立たないニャン

さらに驚かされたのは、そこから2年足らずの間に渡辺明竜王とほぼ互角の勝負をするレベルにまで到達してしまった事です。(2007年のことでした)
そして、この評価関数の精度があるレベルをこえた時点で、人間は「AI」に歯が立たなくなったのです。

この急激な進化の背景には「機械学習」に「強化学習」という手法が結びついたことも大きかったようです。

「強化学習」とはコンピュータ同士で対局して、勝ったほうの指した手が優れているとして価値づけていく手法です。
ランダムに繰り返すので効果が出るまでには時間がかかるのですが、教師役としてのプログラマも必要ないので電源さえ入れておけば億単位の対局をこなすことも不可能ではないのです。

人間も日々努力を積み重ねて研究を続けるのですが、睡眠も食事も取らずに自分自身の中で対局を繰り返してレベルを上げていく「AI」に勝てるはずはないのです。
そして、ちょっと恐いのは、その評価関数を生み出すためのパラメータはプログラマが与えているのですが、そのパラメータの変更した部分が結果としての評価関数の生成にどのように影響しているのかは誰にも分からないと言うことです。

この「分からない」と言うところに、ある閾値を超えた時点で「AI」が暴走するのではないかという懸念が生じるのですが、それはまた別の話です。

この急激な「AI」の進化に対して、始めの頃は、人間と違って「焦る」事も「震える」事も、そして「疲れる」事もないのだから生身の人間が勝てるはずはない等と言われたこともありました。
しかし、事の本質はその様なところにはありませんでした。
事の本質は、「AI」が10手先、20手先に予想される局面を正確に探査して、その探査した局面の優劣を「評価関数」で正確に数値化して、最も価値があると思われる指し手を選択してくる事にあるのです。

そして、それによって明らかになったのは、人間ならば長年の経験で切って捨てていた「選択肢」の中にも局面を優勢に導く指し手が「たくさんあった」と言う事でした。。
そして、困ってしまうのが、その「評価関数」に従って最も「価値のある」ものとして選択される「指し手」が、往々にして人間の感覚からすれば受け入れる事が難しい「指し手」が多いと言うことです。。

人間というのは「習慣」の生き物です。

人間という生き物は、日々の生活スタイルから思考の進め方、価値判断の基準に至るまで、それらは長年の経験に基づいてパターン化され、そのパターンは「習慣」のレベルにまで定着させることで日々の暮らしをスムーズに送れるようになっています。
私たちが暮らしている現在の「社会」というものは、生物としての「人間」から見れば異常極まりない「環境」なのですが、その異常極まりない「環境」の中でも問題なく日々すごせているのは、それを「習慣」という名によってねじ伏せているからです。

そして、その「習慣」は集団としてのコンセンサスとしての「常識」の中に収まることでより安定したものになります。
しかし、「AI」はこの安定した「習慣」と「常識」に対して異議申し立てを行う可能性が強いのです。

「AI」はこの桜を美しいと思うのだろうか?

江戸時代以降、400年以上にもわたって「将棋の職業集団」としての「プロ棋士」が積み上げてきた「常識」が「AI」によって覆されつつあるのです。
これと同じ事態が、「AI」のさらなる進化によって、より幅広い分野でも引き起こされるだろうと考える方が自然なのです。

それだけに、藤井聡太に代表される若手棋士の台頭が意味しているものは大きいのです。
それは、現時点では将棋などの狭い世界の中に留まっているのですが、それらはやがてはさらに幅広い分野において多くの人が直面するであろう課題を突きつけているかもしれないのです。

その課題とは何かと言えば、人間的感覚からすれば受け入れる事が難しい「AI」の「選択」をスムーズに自分の中に取り入れることが出来なければ大きな困難に直面するかも知れないという「課題」です。
問題はこの「スムーズ」という部分にあって、何も考えずに「AI」の選択を真似るだけでは駄目であり、その「選択」を自分の中で徹底的に咀嚼した上で受け入れる「能力」が求めらているのです。

そして、将棋という狭い世界の中だけに限ってみれば、「将棋」の棋力とは正比例しないと考えられていた「詰め将棋」の解答能力が大きな意味を持っているように見えるのは実に示唆的なのです。(続く・・・)


3 comments

  • モーツアルトのピアノソナタを、AI君に憶えさせて、作曲を依頼したらまた新たな曲が出てこないかと、ユングさんの随筆を見ながら思いました。

    • yung

      AIによる作曲は既に「実用化」の段階にまで来ているようですね。まあ、歴史を遡れば、コンピューターがはじめて作曲したのは1950年代という話もありますから、おそらく将棋とかのボードゲームよりも取っつきやすかったのでしょうね。
      ただし、それがどこまで「芸術的」かとなると意見はいろいろありそうですが、それでも「芸術的」とは何かという面で「匕首(物騒な表現ですが^^;)」を突きつけられるときが来るかも知れませんね。

      「ゲイジュツテキトシュチョウシテイルアナタガサッキョクシタオンガクハ、ワタシノヒョウカカンスウデハ50テンデス。
      ソレニタイシテ、ワタシガサキョクシタオンガクハ、ヒョウカカンスウニヨルト200テンヲシメシテイマス。」

      なんて言われたら、どうしましょう。(^^v

  • AI君の作曲したピアノソナタを、愛好家が評価して、それを何回か繰り返せば、モーツアルトの及びもつかない曲が出来上がるのではと。こいうことは将棋より作曲のほうが得意なのではと、素人ながら思っております。天才達は皆早死しているので、ついついこんな願いが浮かんでおります。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です