思考整理メモ：これからのAI技術を迎え撃つのに必要なのは「生成モデルの哲学」？

人工知能について、ここしばらく考えていることを書きます。

言いたいのは、

これからの人工知能を考えるに際して、「生成モデルの哲学」が必要なんじゃないか？

ということです。試論というか、妄想というか、素人のたわごとレベルですが、何かの思考の糧になればと思い、文章にしておきます。

※本記事を書こうと思う直接のきっかけになったのは、2019年6月5日の統計数理研究所のオープンハウスにて、チュートリアル講演「深層学習の理論と発展」を聞き、深層生成モデルの一層の進歩を実感したことでした。

AI技術の目玉？　深層生成モデル

ディープラーニングの成功によって始まった2010年代の「人工知能ブーム」。よく取り上げるのは「画像診断」や「自動運転」といった「認識」系のアプリケーションですが、ここ数年は「創作」系のアプリケーションが、AI技術の目玉として目立ち始めている感があります。

作曲、作文、描画、CG作成など、さまざまなジャンルの創作活動を「AIが行った」とするデモンストレーションが出てくるようになりました。GAN（敵対的生成ネットワーク）などの「深層生成モデル」の技術が、それを可能にしたと言われます。

深層生成モデルを使えば、あたかも人間がつくったかのような作品がつくれるほか、実在しない風景、人の顔、声などを生成することができます。当然、フェイクニュースが容易に作れてしまうなどの懸念があるわけですが、ここではそうした倫理的問題とは少し違う角度から、「（深層）生成モデルが提起する哲学的問題」について考えてみたいと思うのです。

生成モデルとは？

まず、生成モデルとは何か。

少し調べた限りでは、生成モデルの説明の仕方には複数あるようで、なかなか難しいのですが、自分なりの理解で書きます（※正確ではないかもしれません。明らかな誤りがあれば、ぜひご教示ください）。

生成モデルとは、所望の性質をもつデータxを生み出す確率分布P(x)のこと。たとえば、所望のデータを「リンゴが映っている画像」だとする。xが存在する多次元空間（256×256ピクセル画像の空間など）のなかで「リンゴの画像」が占める領域があるはず。ただし、それは0と1の2値で決まるわけではなく、各点xに対して0から1までの確率値P(x)が割り振られていると想定する。このP(x)を作ってしまえば、そこからサンプルをもってくることで、ありとあらゆる「リンゴが映っている画像」を生成することができる。

生成モデルは、「リンゴの画像」だけでなく、「オバマ大統領が映った写真」「ゴッホの絵」「バッハの曲」についても作ることができます。そんな大がかりな生成モデルが作れるようになったのは、数千万～数億個ものパラメタを持つ深層ニューラルネットが使えるようになったため。そして、大量のデータから生成モデルを学習するためのアルゴリズムが発明されたからだと理解しています。

考えれば考えるほど、この生成モデルは強力なものに思えてきます。生成モデルさえあれば、「ゴッホが描いたすべての絵」を判別できるばかりか、「実際には描かれていないがゴッホが描いたとしか思えない絵」を生成することもできる。人間にしかできない知的作業を機械で実現するのが人工知能研究の目的だとすれば、生成モデルの獲得こそが人工知能の目標、というか生成モデルが人工知能そのもののようにすら思えてきます。また、私たち自身の脳も、つまるところは「先天的進化と後天的経験でトレーニングされた生成モデル」だと言ってもおかしくないようにも思えてきます。

今後、ますますいろんなジャンルで、生成モデルから出力されたにもかかわらず「本物（人間がつくった or 自然界に存在する）にしか見えない」ような、画像、文章、音声その他が出てくるでしょう。そこで考えるべきは、「生成モデルはどこまでリアル（実在）か？」という問題だと思うのです。

生成モデルはどこまでリアルか？

生成モデルの学習があらゆる分野で進んでいったとき、それは人間の創造性に比肩し、超えていくような存在になるのか？　いくつか疑問が浮かびます。

生成モデルは、データから本当に学習できるのか？
そもそも「真の生成モデル」はあるのか？
生成モデルがつくれないものはないのか？　あるとしたらなぜ？
人間の脳は生成モデルなのか。生成モデルとしての理解に不足点があるとしたらどんなことか。

一つ目の問いは、「現実問題として、十分な精度の生成モデルは得られるのか？」というもの。有限のデータから、連続的な空間の確率分布を推定する以上、そこには近似があります。データがどれくらいあれば、十分な生成モデルが学習できるのか。本当に、すべてのジャンルで、生成モデルはつくれるのか。もしかしたら、限られた分野でしか成功しないのではないか。これは、哲学というよりは統計理論の課題かもしれません*1。

二つ目は、「生成モデルの実在性」とでも呼びたい問題です。ここまでは、生成モデルはある概念（「リンゴ」、「ゴッホの絵」）を十全に表現するもの――「イデア」のようなもの？――であるかのように書いてきましたが、よく考えると、そう単純でもないことに気づきます。たとえば、生成モデルとしてのP(x)は、そもそもxの空間を決めないと定義できません。「256×256ピクセルの画像の空間」のなかでP(x)が定まるのであって、それ以外の設定にしたら、そのP(x)は役に立たない。生成モデルはメディアに依存する、もしくは「生成モデルにもフレーム問題がある」なんて言ってもいいかもしれません*2。こう考えていくと、「イデア」のごとく見えていた生成モデルが、急に「ハリボテ感」を帯びてきます。

三つ目、四つ目は、人間の知性や創造性がどこまで生成モデル、ないしは「データからの推論」に還元できるのか、という点にまつわる問題意識です。

求む！？「生成モデルの哲学」

このような疑問について、ああでもない、こうでもないと考察を深め、生成モデルにできること／できないことの輪郭を探っていくのが、私の考える「生成モデルの哲学」です。

やはり、深層学習の成功のインパクトは絶大で、科学の在り方にも影響を与えるのではないか、との議論もあります*3 。生成モデルへの期待も、その威力を考えれば当然のものだと感じます。これから、生成モデルはたくさんのショッキングなデモンストレーションを繰り出してくるはずです。多分に、人間としてのアイデンティティを揺さぶられることになると思いますが、そのなかで少しでも冷静な頭でいるために、「生成モデルの哲学」が求められているのではないかと思う次第です。

*1:この辺りは関係してくるかも：渡辺澄夫「真の分布を知ることができる限界について」http://watanabe-www.math.dis.titech.ac.jp/users/swatanab/waic_comment.html

*2:このあたりは伊庭幸人「確率と存在―世界を切り分ける方法こそが重要である」『数理科学』（2013年）などに着想を得ています。

*3:cf：深層学習は科学に「理解」の放棄を迫るのか？：「高次元科学への誘い」（丸山宏）へのコメント - 重ね描き日記（rmaruy_blogあらため）