重ね描き日記(rmaruy_blogあらため)

読書メモ、探究メモなど。

続・どうすれば脳を「理解」できるのか: 分かり方は一つじゃない~脳理解の多元主義へ~

文章:丸山隆一(@rmaruy)

(注)本記事は鈴木力憲さんと書いた「どうすれば脳を「理解」できるのか:「コンピュータチップの神経科学」の続編ですが、本記事の筆者は丸山一人です。鈴木さんとの議論から多くのヒントを得ているものの、基本的には個人の考えで書いています。

 

今年の1月に書いた記事:「どうすれば脳を「理解」できるのか:「コンピュータチップの神経科学」から考える」では、「コンピュータチップの神経科学」を題材に「脳を理解するとはどういうことか」を考えた。

同記事では、「神経科学者はマイクロプロセッサを理解できたか?」と題された2017年の論文(ヨナス&コーディング著)*1を取り上げた。内容は「神経科学の代表的な研究手法を使ってマイクロプロセッサを調べてみた」というもので、その方法ではマイクロプロセッサの動作原理は分からなかったと著者らは結論づける。著者らの狙いは、極端なデモンストレーションを通して、現在の神経科学のアプローチの再考を促すことにあった。それに対して、本記事筆者らは1980年代の神経科学者デヴィッド・マーの「3レベル」の枠組みを持ち出し、それに沿ってヨナスらの主張を批判的に検討してみたのだった。

マーの3レベルとは、「計算理論」「表現とアルゴリズム」「実装」のことだ。脳が実現している特定の「情報処理」に着目して、(1)それを「計算」として定式化し、(2)その計算がどのような情報「表現」のもとどのような「アルゴリズム」で実行されているかを明らかにし、(3)それがどんな神経活動により「実装」されているのかを問う。この3レべルの理解がそろえば、計算機の動作原理を個々のトランジスタの働きから理解するときのような、階層的な脳の理解が得られる。

f:id:rmaruy:20190905222959j:plain

マーの3レベル

ヨナスらの「コンピュータチップの神経科学」では、

  • 細胞(トランジスタ)Aを壊すと行動(ゲーム画面の描画)Bが阻害されるか

といった単純な対応関係しか調べていなかった。そのような、闇雲に「AとBの関係」をカタログしていくだけの手法では、脳の「理解」はおぼつかないだろう。一方、仮説をつくりながらマー式の理解を目指していけば、脳でもマイクロプロセッサでも、少しずつその「理解」に迫っていけるはずだ。前記事にて筆者らはそう結論したのだった。

しかし、これを書いた後、筆者には少なからぬ「もやもや」が残った。その中心は、「マーの3レべルによる脳の理解」への疑問である。

  • 本当に脳はマーの枠組みで理解できるのだろうか?
  • また、その方法が唯一なのだろうか?

おそらく同じような疑問を、前記事を読んでいただいた方の多くも感じたのではないかと思う*2神経科学者の方は(仮に読んでいただいた方がいたとして)、自身が日々やっていることとの齟齬を感じたかもしれない。自分はマーの3レベルの理解なんか目指していない、と。科学者がやっていることの記述としても、目指すべき理念としても、「脳の理解」の意味が「マーの3レベル」で尽きているとは思いにくいのだ*3

そこで、本記事ではマーの枠組み以外の「脳の理解」の仕方を探していきたい。まずは、素朴な違和感から出発してみよう。

 

1.マーの枠組みへの素朴な疑問

何がもやもやするのだろうか。3点ほど思いつく。

  • 古典計算機のアナロジーでいいのか?
  • 脳は情報処理機械なのか?
  • マー流の「理解」はそもそも可能か? また必要なのか?
古典計算機のアナロジーでいいのか?

マーの枠組みは、脳を計算機のごとく理解しようとする。ここでいう「計算機」とは、デジタル回路で組み立てられ、プログラミングによって望み通りの動作をさせられるような従来型のコンピュータのことだ*4。しかし、いま「脳を模したコンピュータ」と聞いたら、まず頭に浮かぶのはニューラルネット*5のことだろう。脳はむしろ、ニューラルネットとして理解すべきではないのか?

脳は情報処理機械なのか?

計算機もニューラルネットも「人工物」だという点で共通している。ある目的のために、人が設計してつくったものだ。それをつくった人は、何らかの意味でそれを「理解」しているのが普通だろう。しかし脳には設計者はいない。人工物と自然が生んだ脳とを等しく「情報処理」として捉えることに、無理はないのだろうか?

マー流の「理解」はそもそも可能か? また必要なのか?

脳には1000億のニューロンがあり、それぞれが数千箇所のシナプスで結合している。そんな複雑な対象を、そもそも人間の認知能力で理解することなどできるのか。そんな疑問もありうる。しかし、深層学習に代表される昨今の機械学習を使えば、脳に関する膨大なデータから脳に関する予測や介入を行うことは可能になるだろう。マーの3レベルなどにこだわらずに、そちらを目指すべきではないのか?

 

こうした素朴な疑問から出発すると、「計算理論」「アルゴリズムと表現」「実装」という仕方以外で脳を理解する方法の可能性がいくつか見えてくる。本記事ではとくに、以下の三つを取り上げてみたい。

  • 脳を学習機械として理解する・・・第2節
  • 脳をBMI機械学習で解読する・・・第3節
  • 脳内現象を「内から」理解する・・・第4節

これらはいずれも、ヨナス&コーディングの「コンピュータチップの神経科学」に比べれば洗練されており、少なくともそれよりは「理解」に迫るポテンシャルをもつと思われる。そして、これらのアプローチはマーの枠組みとは大きく異なる発想に基づいている。さらに、筆者の見解では、これらは現役の神経科学者たちによって実際に採用されている。

以降、一つずつ見ていきたい。 

2.脳を学習機械として理解する

脳を情報処理機械として位置づけるマーの3レベルは、脳を古典計算機のアナロジーで捉える枠組みであった。しかし、いまや「人工知能」と言えば、深層学習に代表される機械学習だろう。したがって、そうした学習機械のアナロジーを使えるだろう。この方向性を、「脳を学習機械として理解する」アプローチと呼んでみよう。

ニューラルネットと記述の圧縮性

脳を学習機械として理解するとはどういうことか。それを考えるヒントになる論文がある。Google DeepMindに籍を置く機械学習の専門家ティモシー・リリクラップ氏と、(またしても)コンラッド・コーディング氏の共著による短いオピニオン論文である。

ニューラルネットを理解するとはどういう意味か?」と題されているが、本題はあくまで「脳の理解」にある。大まかな論旨は以下のとおりだ。

  • 学習済みのニューラルネットの動作を理解することは難しい
  • むしろニューラルネットで理解可能なのは「どう学習しているか」である
  • 脳についても同じことが言えるのではないか

順を追って見ていこう。著者らはまず、「学習済み」の大規模なニューラルネットの動作を理解することは難しいと主張する。その難しさを説明する比喩として、「3目並べ」と「囲碁」という二つのゲームを持ち出している。

3目並べ(tic-tac-toe)では、三つのルール*7を知っていれば、必ず勝つか引き分けることができる。一方の囲碁では、世界チャンピオンが各場面で手を選ぶときの戦略を書き出すのは不可能だ(だからこそ「プロ棋士」が成立する)。このように、3目並べと囲碁では、その戦略(必勝法)を記述するためのルールの数に圧倒的な違いがある。リリクラップらの言葉で言えば、記述のコンパクトさ(compactness)あるいは圧縮性(compressibility)が大きく異なるのだ。

 

f:id:rmaruy:20190905224421p:plain

3目並べは圧縮性が高いが、囲碁は低い(筆者の理解に基づく図解)

そして学習済みのニューラルネットの動作は囲碁に近い、と著者らは指摘する。たとえば、ネコの画像を見て「ネコ」だと判断するニューラルネットは、どんな情報処理によってネコを識別しているのだろうか。それは少数のルールで書き下せるだろうか。もちろんできない(だからこそ、かつての「ルールべースAI」は行き詰まったのだろう)。このニューラルネットには何十万個ものパラメタをもち、現状ではその動作を人間が理解できるほどコンパクトに記述することは難しい*8。よって、マーの3レベルに沿ってニューラルネットを理解することは(少なくとも現状は)できない、ということになる。

ニューラルネットと脳の何が理解できるか

一方、ニューラルネットにもコンパクトに記述できる部分がある。具体的には、ニューラルネットアーキテクチャ(architectures)、損失関数(loss functions)、学習則(learning rule)、最適化手法(optimization)を指定すれば、そのニューラルネットがどんなものかを伝達することができる(=論文に書くことができる)。つまり、ニューラルネットについて圧縮された記述が可能なのは、学習済みの何十万ものパラメタではなく、「どのように学習を行うか」の部分なのだ。

f:id:rmaruy:20190905224500j:plain

学習機械としての仕様は論文に記述できる(左)が、学習済みニューラルネットの動作はコンパクトに記述できない(右)(筆者の理解に基づく図解)

では、脳はどうか。論文にはこうある。

Humans are not neural networks. And yet, the brain has ubiquitous plasticity (...) As such, it is hard to see how the arguments we made above about artificial neural networks would not carry over to the human brain. (...) it may currently be prohibitively hard to understand connection strengths and representations, even if architectures, learning, and development can be meaningfully characterized and communicated.
(意訳)人間はニューラルネットではない。しかし、脳にも遍在的な可塑性がある。よって、人工ニューラルネットに関する上記の議論が、ヒトの脳で成立しないと考える理由はない。(…)ヒトの脳の神経ネットワークの接続強度や表現を理解することは極めて難しい反面、そのアーキテクチャ、学習、発生に関しては意味のある特徴づけと伝達が可能かもしれない。

つまり、学習済みの深層ニューラルネットと同様に、脳もまた圧縮率の高い記述が難しいのではないか。むしろ、現状では、神経ネットワークがどうつながっているかという「解剖学的な特徴づけ」や、DNAの設計図がどのように脳をつくるかという「発生」の問題、そして脳内での「学習のプロセス」を当座の理解の対象とすべきではないか。論文はこう締められる。

Instead of asking how the brain works we should, arguably, ask how it learns to work. (意訳)問うべきは「脳はどうはたらくのか」ではなく、「脳がどのようにそのはたらきを学習するのか」なのだ。

以上、リリクラップらの論文を見てきた。彼らが推奨するのは、言ってみれば、「マーの3レベルの意味での脳の理解の断念」だ*9。脳はニューラルネットのように巨大な数のパラメタをもつ。それを、人間が理解できるほど「コンパクト」に記述できる保証はない。マイクロプロセッサの動作をトランジスタレベルから理解していくといったことは、脳に関しては無理なのかもしれない*10。もっと有望なのは、脳が「いかに学習しているか」の理解なのだ*11

なお、「学習」という視点がマーの3レベルから抜け落ちているという点は、デヴィッド・マーとともに「3レベル」の議論をした神経科学者トマソ・ポッジオ氏も指摘している*12。2010年代の深層学習の成功によって、脳を学習機械として理解しようという方向性は勢いを増している感がある。 

3.脳をBMI機械学習で解読する

前節で見たように、ニューラルネット機械学習は脳を理解するためのアナロジーとして使える。一方、機械学習は、脳を研究するための「道具」として使うこともできる。それは、BMI(ブレイン・マシン・インタフェース)と組み合わせることで威力を発揮する。

BMI機械学習

脳と機械をつなぐBMIの研究は、1990年代に本格的に始まった*13。嚆矢となった研究では、ラットの脳に電極を刺し、ラットの手の動きに関係する運動野の神経活動を利用したところ、ラットは自らの神経活動を使って水飲みのためのレバーを操作できるようになった。その後、サルやヒトでも実験が行われるようになる。また、数本の電極を指すだけでなく、fMRIや脳波といった非侵襲な方法も含め、さまざまなバリエーションの「インタフェース」が開発されていく。今年(2019年7月)に、イーロン・マスク氏率いるNeuralink社が、「千本以上のファイバー状電極を脳に自動で埋め込む技術を開発した」というニュースも記憶に新しい*14

千本の電極で脳内を記録すれば、千本の電位の時系列が得られる*15。脳波やfMRIのような脳活動の計測にせよ、同様に非常に高次元のデータがとれる。その信号の意味を、手作業で解析するのは難しいことは想像に難くない。そこで活躍するのが機械学習である。

機械学習を使えば、脳から得た信号のなかにどんな情報があるかを炙り出すことができる。被験者がある数種類の行動をとっている(たとえば、じゃんけんの「グー」「チョキ」「パー」を出す*16)ときの脳の活動を何度も記録し、それを機械学習にかければ、同じ脳活動からその人が次のじゃんけんで何を出そうとしているのかを予測することができる。どの細胞がどのようなメカニズムで「グー」をつくっているかが分からなくても、ともかく「グー」を出そうとしていることは分かるのだ。

f:id:rmaruy:20190905213850j:plain

脳活動からじゃんけんの手を当てる(この図ではfMRIのデータをそのまま人工ニューラルネット(ANN)に入力するように書いたが、実際のデコーディング研究ではもう少し複雑な処理を行っている)
脳を解読する

このような、脳から情報を読み出す操作は「デコーディング(decoding)」と呼ばれる。脳活動はさまざまな情報を符号化(code)しており、機械学習でそれを解読(decode)できるという考え方だ。この手法の代表的な研究者である神谷之康氏は、

  • ヒトが見ている視覚像を、fMRIの画像からリアルタイムで再構成する
  • 被験者が見た夢の内容を、fMRIの画像から再構成する

といったインパクトのある研究成果を次々と出している*17。また、脳波でも深層ニューラルネットワークを使ったデコーディングが成果を出しつつあるようである。

このようにfMRI、脳波といった非侵襲型の測定手法ですら、脳の情報をかなりの程度読み出せることが分かってきている。イーロン・マスク氏のNeuralinkが実現しようとしている脳内からの電極記録が可能になれば、それと機械学習を組み合わせることで、これまでにない精度でのデコーディングが可能になるかもしれない。

デコーディングは理解か

一見、BMIによる脳からのデコーディングは、脳を「理解する」方法には見えないかもしれない。あくまで脳信号の「利用」を目指すものではないのだろうか。そうとも限らない。たとえば、脳のある部位から得た信号で動物やヒトの特定の行動が予測できれば、その部位が行動の情報をもっていたことが分かる。あるいは、fMRIにより視覚像を再構成できたとなれば、個々の神経細胞活動に比べればだいぶ「ぼやけた」fMRIの信号にも画像の情報が含まれていたということが分かる。これは、脳の情報表現についての、小さくない知見だ。

BMI機械学習による脳からのデコーディングは、脳の「メカニズム(アルゴリズム)」を不問に付したまま、脳活動が何を「表現」しているかを明らかにする*18。その意味で、マーの3レベルとは異なる「脳の理解」をもたらすアプローチとも言えるだろう*19。 

4.脳内現象を「内から」理解する

ここまで、

  • 脳を計算機として理解する(前記事)
  • 脳を学習機械として理解する(第2節)
  • BMI機械学習を駆使して脳内情報を解読する(第3節)

という三つのアプローチを見てきた。しかし、そのどれとも違う道をとる研究者がいる。

ニューヨーク大学神経科学者ジェルジ・ブザーキ氏*20は、2019年の単著The Brain from Inside Out*21にて、「内から外へ」戦略(inside-out strategy)と呼ぶアプローチを提唱する。ブザーキによれば、本記事で見てきたものを含め神経科学の多数派は「外から内へ」(outside-in)戦略をとっており、それへの挑戦者として自らを位置づけている。

「内から外へ」とはどういうことなのか。The Brain from Inside Outの第1章から、その概略を見ていきたい。

「脳=情報処理機械」への異議

同書でブザーキは、マーの戦略に異議を唱える*22。最大の理由が、「情報処理」という見方への不満である。マーは脳を「情報処理を行う機械」とみなした。が、しかし脳はどんな「情報」を「処理」しているというのだろうか。

長めに引用する。

Computation performed by computer programs or machines is referred to, in general, as “information processing”. In reality, the information is not in the processing. It becomes information only when interpreted by an observer that recognizes its meaning and significance, be it a human interpreter or a mechanical actuator. A computer program can effectively control a robot or other man-made machines, thus giving rise to the illusion that information resides in the program. However, the process is based on a human-designed solutions even if it involves a complex trial-and-error learning process, including “deep learning” in artificial intelligence programs. In short, information is not inherent in the computation (in machines or brains) but becomes such when it is interpreted.  (The Brain from Inside Out、p.28)
(意訳)コンピュータプログラムや機械によって実行される計算は、一般に「情報処理」と呼ばれる。しかし、実際には情報は「処理」の内にはない。情報は、その意味と重要性を認識できる観測者人間でも機械的なアクチュータでもいい)がそれを解釈したときに、情報になるのである。コンピュータプログラムは、ロボットなどの人工機械を効果的に制御することができる。そのために、プログラムに情報が内在しているという幻想が生まれる。しかし、その計算プロセスは人間が設計した解法にすぎず、人工知能プログラムとして用いられる「ディープラーニング」を含む複雑な試行錯誤を伴う学習のプロセスですら例外ではない。要するに、情報は計算(機械あるいは脳における計算)に内在しているのではなく、それが解釈されるときに情報になるのである。

何が言われているのだろうか。本記事筆者なりの理解はこうだ。

マー3レベルの脳理解をうんと単純化すると、次のような形式になる。

  • 「神経活動Aが、情報処理Bを行っている。」

この「情報処理Bが実現している計算は何か(what)」を定式化するのが「計算理論」のレベルであり、「どのようにAがBを実現するか(how)」が「アルゴリズムと表現」および「実装」のレベルだ。脳が何らかの情報処理Bを行っていることが大前提であり、Bが被説明項(explanandum)、Aはその説明項(explanans)とみなされる。

ブザーキが問うのは、「しかしBはどこからやってきたのか?」ということだ。科学者の頭の中からではないのか。神経活動Aは、「情報処理B」のことなんか知らない。たとえば一つの神経細胞の活動をAとするなら、Aが知り得るのはその細胞に投射される神経細胞からの入力だけだ。マイクロプロセッサのなかのトランジスタとは状況が違う。トランジスタの場合は、それはプロセッサ内で行われる四則演算といった「情報処理をしている」と言ってよい。なぜなら、マイクロプロセッサの設計者がそのような役割をトランジスタにあらかじめ与えたから*23

ここに、アナロジーの落とし穴がある。ブザーキは言う。

A metaphor is a powerful tool to convey an idea because it relates a mysterious phenomenon to an understood one. However, metaphors can also be misleading because they may give a false sense of understanding a novel phenomenon before it is actually known how the thing works.  (The Brain from Inside Out、p.12)
(意訳)メタファーというのは、アイディアを伝えるための強力な道具だ。謎に包まれた現象を既知の現象に関係づけてくれる。しかし、ミスリーディングでもありうる。新奇な現象について、その仕組みがまだ分かっていないのに、理解したという間違った感覚を生んでしまうことがあるからだ。

「情報」だけではなく、「計算」や「表現」についても同じだろう。

  • 神経活動Aが「計算B」をしている。
  • 神経活動Aが「表現(表象)B」をもつ。

といったような、脳の観察に基づかない外から持ってきた概念「B」を想定するようなあらゆる方法は、ブザーキに言わせれば「外から内へ」戦略である。本来、脳を研究するまでは、Bが何かを知ることはできないはずだ。だから、神経活動Aの「意味」は、科学者が勝手に考えた概念を当てはめるのではなく、その神経活動から新たにつくっていかなければならない*24。この方針を、ブザーキは「読み手中心の視点(reader-centric view)」、あるいは「内から外へ」戦略と呼ぶ。

Brain from Inside Outは、ブザーキ流の「内から外へ」(inside-out)方式を使って、広範なテーマにわたる脳の理解を試みた一冊となっている。筆者にはその全貌を要約することは到底できないが、ここではごく一部を手短に見ていきたい。取り上げるのは、「海馬の場所細胞」と「シャープウェイブ・リプル波」だ。

場所細胞

ブザーキ著の少なくない部分が、「場所細胞」の話題に割かれている。場所細胞(place cell)は、空間内の特定の「場所」に動物が来たときにだけ活動する神経細胞のことで、1970年代にジョン・オキーフ氏によってラットの海馬で発見された(オキーフ氏はその業績で2014年ノーベル生理学・医学賞受賞)。その後、ヒトを含む多くの動物も場所細胞をもつこと、さらには海馬および海馬近傍には場所細胞以外にも空間情報処理にまつわる細胞(「head direction cell」「grid cell」など)が存在することがわかってきている。

 

f:id:rmaruy:20190905214943j:plain

https://en.wikipedia.org/wiki/Place_cell#/media/File:Place_Cell_Spiking_Activity_Example.png 場所細胞の模式図。ラットが迷路内を移動する間、その海馬の細胞の活動を測定する。各点はそこにラットが来たときに細胞が発火したことを示し、同じ色は同一の細胞を表している。

場所細胞は、動物が空間(部屋や迷路)を探索するにつれて、次第にその性質を獲得する。さながら、人が未開の地を歩きながら「地図」をつくるかのように、自分が歩いた距離や、眼から入ってくる外界のランドマークを利用しながら、次第に脳内に地図を作り上げている。つまり、場所細胞は、外界の位置情報を「表現」しているようなのだ。マーの枠組みがピッタリ当てはまる事例のようにも思える。実際、自律ロボットで実用化が進んでいるSLAM(simultaneous localization and mapping)の技術は、海馬のはたらきになぞらえて説明されることがある*25

しかし、話はそう単純ではない。場所細胞は「位置」だけの情報を表現しているとは言えないのだ*26。ブザーキらを含む多くの研究チームが場所細胞について調べてきた中で、

  • 同じ場所にいるとき(歯車のなかで走っているときなど)にも活動する
  • 寝ているときも活動する

といったことが分かっている。さらに興味深いのは、ある経路をラットが走ったときに現れる「a→b→c→d→e」という一連の場所細胞の発火(シーケンス)*27が、安静時に数倍速で再生される「リプレイ」現象である。また、経路を走る前に、その経路を表すことになるシーケンスがあらかじめ再生される「プリプレイ」も知られている。

場所細胞のこうした数々の挙動は、「外界の位置の情報を、細胞活動が記銘している」という「空白の石板」(tabula lasa)的な発想では説明できない。「プリプレイ」の現象からも分かるように、海馬の細胞は外界からの入力以前にすでに固有の活動パターンをもっている。むしろ、脳があらかじめ持っている活動を、あとから動物の経験に合わせてマッチさせ、「意味」を持たせているのではないか、とブザーキは考える。場所細胞が単純に「場所」を「表現」していると思うのは、「外から内へ」式のアプローチの罠だ。

シャープウェイブ・リプル波

ブザーキが精力的に研究してきたもう一つの脳内現象が、脳内の振動現象、とくに「シャープウェイブ・リプル波(sharp wave ripples:SPW-Rs)」だ。これは、海馬のCA1領域でみられる特徴的な細胞外電位(local field potential)の波形であり、大きくて鋭い波形(シャープウェイブ)に、極めて速い振動(リプル)が重なった形をしている。

f:id:rmaruy:20190905215120j:plain

シャープウェイブ・リプル波の波形

この波形をはじめて見たとき、ブザーキはてんかん性の異常な活動だと思ったらしい。しかし、この波形はすべての哺乳類で見られ、立ち止まっているときやノンレム睡眠中などに高頻度で発生する。異常な脳活動にしては、普遍的すぎる。ブザーキはこれが何か重大な機能を持っているのではないかと考え、30年来研究を続けてきたのだという。

驚くべきことに、前項で述べた場所細胞のシーケンスが、このシャープウェイブ・リプルに載せて高速再生(リプレイ)される現象が発見される。そして、

  • この波形に載せて、海馬から皮質へ強い同期した出力がなされる
  • この波形が出ないようにすると、その前に行った課題の記憶に障害が出る
  • ノンレム睡眠中に皮質から海馬に向かって出される脳波(スピンドル波)とシャープウェイブ・リプルのタイミングに相関が見られる

といった状況証拠から、シャープウェイブ・リプル波が「海馬から皮質への記憶内容の伝達」を担っているのではないか、と推論する。

以上はブザーキの本のごく一部の内容にすぎず、場所細胞とシャープウェイブ・リプル波に限っても、もっと多くの現象や仮説が述べられている。しかし、上記の例で彼のアプローチのエッセンスは伝わるのではないかと思う。つまり、脳内でみられる顕著な現象に注目し、さまざまな実験を通してその現象を特徴づけ、その現象の「脳にとっての意味」を考えていく。

ブザーキのWebサイト*28を開くと、

  • Search for a neural syntax 

というサブタイトルが目を引く。個々の細胞の活動や脳波を脳内現象における「文字や単語」とみなし、それを「意味」のあるものにする「構文(syntax)」を探す。これがブザーキの「内から外へ」戦略なのである。

「内から外へ」戦略再考

恣意的な被説明項を持ち込まず、脳の現象を丹念に見ることから脳の「構文」を探すというブザーキのアプローチは魅力的だ。しかし、Brain from Inside Outを通読した感想としては、いくつか疑問も浮かぶ。

  • 完全な「内から外へ」など可能なのか。ブザーキ自身も場所細胞やシャープウェイブ・リプル波の意味付けに、「空間」「時間」「速度」「記憶」などといった素朴な心理学用語を使っている。「外」を想定しないという主義は、彼が言うほどには徹底されていないのではないか。
  • また、「内から外へ」はマーのアプローチと本当に相反するものなのか。むしろ、場所細胞やシャープウェイブ・リプル波といった神経現象から出発し、それが担っている「アルゴリズム」や「計算」を考えるという方向に研究を進めることも自然なのではないか*29
  • ブザーキの描く脳の理論は面白いが、一部のソリッドな結果を除けば、「それらしい物語(just-so story)」の域を超えていないのではないか。

このように考えていくと、他のアプローチの代替案というよりは、他のアプローチの「前段階」だと見ることも可能かもしれない。また、彼の研究姿勢は革新的なものというよりも、むしろ「古き良き神経科学」にも見えてくる。

しかし、本節冒頭で述べた「マーの枠組みへの批判」は一定の説得力があるし、理念としての「内から外へ」は傾聴に値するだろう。場所細胞に相当するような、脳の理解を飛躍的に前進させる脳内現象はまだたくさんあるかもしれない。安易にアナロジーを使うことは、神経科学者がそれを見つけるのを妨げてしまうかもしれない。 

5.分かり方は一つじゃない〜脳理解の多元主義へ〜

話をまとめていきたい。本記事そしてその前の記事では、そもそも「どうすれば脳を「理解」できるのか?」という問いから出発した。単に、

  • (0)神経活動と行動(など)の相関をとる

だけでは「理解」にはいたれず、前記事では有力な枠組みとして

  • (1)マーの3レベルに沿って理解する

を提示した。けれども、それだけでは不十分であることを本記事では見てきた。そして、以下の三つの理解の仕方を検討した*30

  • (2)学習機械として脳を理解する
  • (3)脳をBMI機械学習で解読する
  • (4)脳内現象を「内から」理解する

 

f:id:rmaruy:20190905215853j:plain

四つのアプローチの(とても大雑把な)図解

もちろん、実際の神経科者のアプローチがこのどれかに分類されるわけではない。この「ハイブリッド」としてしか捉えられないような研究者がほとんどだろう。また、すべての脳理解へのアプローチがこれで尽きるわけでもない。(1)~(4)以外にも、たとえば

  • 脳をシミュレーションで再現する
  • 脳の働きを説明する第一原理的な法則を構想し、そこから演繹的に何が言えるかを検討する*31

などがすぐに思いつく。

このように、本記事の4分類は排他的でも網羅的でもなく、しかも恣意的なものでしかない。そのことを断ったうえで、もう少しだけ考えさせてもらいたい。

各アプローチの到達点・目的

当然、四つのどの理解の仕方が正しく、どれが間違っているということはない。それぞれ異なる到達点や目的があるからだ。

では、(1)~(4)のアプローチの目的とは何だろうか。その理解が達成されたあかつきに「何が得られるか/つくれるか」を考えると分かりやすいと思う*32

  • (1)マーの3レベルに沿った理解が得られれば、そのアルゴリズムと表現を使って脳の計算が再現できる。しかもその動作原理もすべてわかっているので、これを「古典計算」として実行できる。いわばホワイトボックスなAI/ロボットがつくれるようになる*33
  • (2)学習機械として脳が理解できれば、その知見を機械学習のタスクに活かすことが考えられる。いわばブラックボックスなAI/ロボットがつくれる。いわゆる、「汎用人工知能」への道筋として最も有望なアプローチかもしれない。
  • (3)BMI機械学習による脳の解読ができることの医学的メリットは明白だろう。四肢を動かせない人が脳で考えただけで機械やコンピュータを動かせるようになるかもしれない。また、「理解」の常識的な意味からは離れるにせよ、この方法が脳を「理解する」唯一の方法だという可能性もある。さらに脳からのデコーディングだけでなく、脳への介入を組み合わせることで脳科学を大きく前進させる可能性をもつ*34
  • (4)脳内現象に解釈を与えていく方式では、そこで得られる理解によってすぐに「何かがつくれる」ことはないかもしれない。しかし、このアプローチにしかない重大なメリットがある。それは、あらかじめ「計算」や「行動」の被説明項を設定しないため、今まで思いもしなかったヒトや動物の能力が発見される可能性があるということだ。海馬細胞の顕著な活動パターン、REM睡眠中の脳波の波形、そういった何をやっているか分からない脳現象の「意味」を考えていくことは、ヒトや動物の「心」について、新しいことを教えてくれる可能性がある。

表:脳理解の四つのアプローチの概要

 

概要

目標(と典型的な問い)

何が得られる(つくれる)か

備考

(1)マーの3レベル

脳を(古典)計算機として理解する。

 

計算理論、アルゴリズムと表現、実装の3レベルの理解

 

「脳はどうやって○○をなしとげているのだろう?」

ホワイトボックスなAI/ロボット

・古典計算機のアナロジーに強く縛られており、厳密にこれに沿って研究しようと思うと窮屈かもしれない。3レベルの理解が得られていると言える事例は少ない。

(2)学習機械としての脳

脳を学習器(ニューラルネットなど)として理解る。

脳が使っている学習則の理解

 

「脳はどうしてこんなに効率よく学習できるのだろう?」

ブラックボックスなAI/ロボット

・学習以外の側面は捨象される?

(3)BMI機械学習

機械学習を用いて、脳内から情報を読み出す。

脳内に表現されている情報のデコーディング

 

「脳からどれだけの情報を取り出せるだろうか?」

医学応用

・「脳を高次元科学する」ことに相当

・実は「脳を理解する」方法はこれしかない可能性も?

(4)脳内現象を「内から」理解する

脳が行っている「計算」や「情報処理」についての仮定を置くことなく、個々の神経活動の「意味」を考える。

個別の神経活動に対して科学的説明を与える。

 

「この神経活動は何を意味しているんだろう?」

脳についての予期せぬ発見

(素朴心理学をアップデートできるかも。)

・人間で行うことは難しい場合がある。

・「内から外へ」な理解が得られても、それで何かが「つくれる」ようになるとは限らない。

 

科学の多元性とそのメリット

科学史・科学哲学者ハソク・チャン氏は、その著書Is Water H2O?*35にて、19世紀の化学の歴史を独自の視点で丹念に研究している。19世紀は分子化学が大きく発展した時代であり、プリーストリー、ドルトン、ラヴォアジェ、ファラデー、アヴォガドロといった著名な科学者たちがいかに自説を競っていた。そこでは、互いに相容れないアプローチ*36が並立しており、チャンはこれを化学の「多元的」(pluralistic)な状況として描く。彼によれば、19世紀の化学はまさに多元的だったからこそ生産的だった。そこから一歩踏み込み、科学は多元的であるべきだ、とチャンは結論する(詳しくはこちら:https://rmaruy.hatenablog.com/entry/2019/05/11/065250)。

科学が多元的であることに、どんなメリットがあるのか。“Is Water H2O?”の最終章では、その利点が列挙されていく。以下はそれを本記事に合わせて簡略化したものだ。

  • 掛け金分散(hedging the bet):どの道筋が成功するか分からないので、多くの道筋を残しておくのがよい。
  • 領域分割(division of domain):一つのアプローチがすべての領域をカバーすることは望めない。
  • 異なる目的の充足(satisfaction of different aims):科学における多様な価値/目的をすべて一つのアプローチで充足できるとは考えにくい。
  • 複数による充足(multiple satisfaction):成熟した科学では、同じ現象を複数の体系で理解できる場合がある。それは歓迎すべき冗長性である。
  • 統合(integration):複数のアプローチを統合することで、特定の目的をよりよく達成できるかもしれない。
  • 取り入れ(co-optation):あるアプローチのアイディアや結果を別のアプローチに取り入れる(co-opt)することができる。
  • 競争(competition):統合や取り入れがなされなくても、アプローチ間の競争が生産的な場合がある。

f:id:rmaruy:20190905224551j:plain

Chang(2012)Ch.5で列挙されている、科学の多元性のメリット(筆者の理解に基づく図示)

今の脳研究は、19世紀の化学と同じくらい、もしかたらそれ以上に、発展途上の分野だ。(1)~(4)のアプローチのどれが(あるいはそれ以外が)功を奏するかはまだ誰も分からない。だからこそ、上記の七つのメリットすべてを神経科学は享受できるはずだ。脳の分かり方は一つではないし、それでいい。この「脳理解の多元主義」を、本記事のひとまずの着地点としたい*37

 

おわりに

本記事では、「マーの枠組み」への違和感から出発し、「脳理解の多元性」というところまで一応たどり着いた。脳の理解の仕方は一つではない。一方、「みんな違ってみんないい」ということが言いたかったというと、そうではない。

今後、本記事で整理した(1)~(4)の理解も、どれかが勢力を増したり、逆にどれかが廃れたりするだろう。また、この区分自体も、流動的に変わっていくはずだ。(4)「ブザーキの「内から外へ」」とその他の関係については第4節で少し触れたが、それ以外にも、

  • (3)のために開発された脳測定技術が、他のアプローチにおける研究ツールとなる
  • (1)を拡張することで、(2)を取り込むような枠組みに進展する
  • 脳と学習機械が相互につながることで、(2)と(3)の区別がつかなくなっていく

など、さまざまな展開が考えられる。

「脳の理解」とは、時代ごとに移ろう「動く標的」(moving target)でもある。だからこそ、異なる脳理解へのアプローチがあることを認識し、その関係性をある程度の解像度で捉える必要があると感じる。本記事は、筆者自身が今後の脳研究を見ていくための「見取り図」として考えたものである。

 

謝辞

前記事の共同執筆者の鈴木力憲さんに感謝します。また、本業で大変お世話になった田中宏和先生には、一連の考察を始めるきっかけを与えていただきました。大著『計算論的神経科学』*38を書き上げてなお、先生が「脳をどう理解すればよいかは、分かんないんです」とおっしゃっていたことが、このテーマについて考え続ける原動力になりました。前記事を読んでコメントをくれた方、本記事のレビューにご協力いただいた皆様に感謝します*39。また、Is Water H2Oの読書会に参加してくれたメンバーの皆様にも御礼を申し上げます。本記事に対しても、引き続きたくさんのご批判とご指導をいただければ幸いです。

 

*1:Jonas, Eric, and Konrad Paul Kording. "Could a neuroscientist understand a microprocessor?." PLoS computational biology 13.1 (2017): e1005268. https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1005268

*2:実際、そうした感想を多く目にした。

*3:※前記事の段階では、「脳を理解する」ことの意味を捉えるうえでマーの3レベルくらいしか明確にイメージできるものが筆者らにはなかった。そこで、不満が残りながらも、ひとまずはマーの枠組みに依拠することにしたのだった。

*4:丸山宏のブログ記事「計算の未来と社会」では「計算」概念を4階層に区分している。ここで言う従来型のコンピュータが行う計算は、同記事の「古典計算」に相当する。https://japan.cnet.com/blog/maruyama/2019/08/21/entry_30022971/

*5:本記事で「ニューラルネット」と書くときには人工ニューラルネットワーク(ANN)のことを指すことにする。

*6:2019/9/5時点では未査読。

*7:「勝てる手があれば勝つ」、「相手の勝ちを防ぐ」、「角を取る」だそうである。筆者は先手番では「真ん中をとる」が正解かと思っていた。

*8:ただし、学習済みの深層ニューラルネットについて、その動作を理解可能にしようという試みは精力的になされていると聞く。この方向性の研究については、今泉允聡氏(統計数理研究所)のスライドがとても参考になる。https://www.ism.ac.jp/openhouse/2019/index/ISM-75-tutorial-imaizumi.pdfちなみにリリクラップ&コーディングも、ニューラルネットの動作理解のための中間的な言語(intermediate language)が存在する可能性は否定していない。

*9:「いや、そうではない」とマーが存命であったら言うかもしれない。ニューラルネットの「損失関数」を計算理論のレベルの理解、アーキテクチャ・学習則・最適化手法を「アルゴリズム」および「実装」のレベルの理解とみなせば、3レベルの理解に当てはめることができる、と。このように、マーの枠組みは異なる階層の「計算」に適用できる点で、その汎用性は侮れない。

*10:コンラッド・コーディング氏は前記事の「コンピュータチップの神経科学」の著者でもあり、この主張は翻意のように見えるかもしれない。しかし、「コンピュータチップの神経科学」の論文でも、「脳はマイクロプロセッサである」とは言っていないことに再度注意したい。彼らの論理は、「マイクロプロセッサくらいは理解できる手段で脳を研究しなければいけないのでは?」というものだった。同様に、今回の論文でも「脳はニューラルネットである」とは言っていない。馴染みのある人工物を引き合いに出しながら読者の想像力に訴えかけるコーディング氏の手法は見事だが、そのロジックは注意して読み解かなければいけない。

*11:前述のように、ニューラルネットの「学習の仕方」は学習済みニューラルネットのパラメタよりはるかにコンパクトに記述できる。これは、ニューラルネットの複雑さを「訓練データセット」の複雑さに押し付けているからである。これを踏まえれば、「脳の学習の仕方」に着目するアプローチは、脳の複雑さを「脳が経験する外の世界の複雑さ」に押し付けていると言えるだろう。

*12:Poggio, Tomaso. "The levels of understanding framework, revised." Perception 41.9 (2012): 1017-1023. http://cbcl.mit.edu/publications/ps/MIT-CSAIL-TR-2012-014.pdf

この論文で、ポッジオは「3レベル」のうえに「学習」と「進化」を加えた「5レベル」を提唱している。ただし、四つ前の注で述べたように、「学習」自体にマーの3レベルを適用しうることには注意が必要だ。

*13:櫻井芳雄『脳と機械をつなぐとき』(岩波書店、2013年)などを参考にした。

*14:紺野大地「イーロン・マスクとNeuralinkは脳科学をどう変えるのか」https://note.mu/daichi_konno/n/n2275ea0301f6

*15:信号解析を行えば、それ以上の数の神経細胞の活動が分かる。

*16:※この例は「【脳科学の達人2017】神谷 之康 "ブレイン・デコーディング 脳から心を読む技術”【第40回日本神経科学大会 市民公開講座】」https://www.youtube.com/watch?v=1jmVr1nDvq4から。

*17:Horikawa, Tomoyasu, et al. "Neural decoding of visual imagery during sleep." Science 340.6132 (2013): 639-642.など。筆者はこれらの原著論文の本文は読めていない。

*18:デコーディング研究は脳な表現を知るという「科学」の目的のためになされるだけでなく、むしろ「脳の信号を使って義手を動かす」といったような医学・工学応用に主眼がある。丸山宏は、「非常に多くのパラメタがあるが、それぞれがお互いを束縛しながら動くことで出来るモデル」で扱わざるを得ない対象に対し、従来の科学的方法による理解を目指すのではなく、深層学習による予測や制御の実現を目指すアプローチを「高次元科学」と呼んでいる。本節で紹介したアプローチは「脳を高次元科学する」ことに相当するとも言えるだろう。https://rmaruy.hatenablog.com/entry/2019/05/01/164325

*19:本節では「脳からの解読」のみを取り上げたが、脳活動をさまざまな仕方で「操作」する手法も発展してきている。そうしたBMIによる脳の「操作」は、「解読」以上に脳の理解に向けた重要な研究手法になると考えられる。

*20:Buzsakiは発音が難しい名前で、学会の講演などで「ユーリ・ブジャーキー」のように呼ばれているのを聞いたことがある。ここでは訳書『脳のリズム』に合わせて、「ジェルジ・ブザーキ」とした。

*21:日本では、ほぼ同じタイミングで彼の前著である『脳のリズム』(渡部喬光監訳、谷垣暁美訳、2019年、みすず書房)が発行された。

*22:“I respectfully disagree with Marr’s strategy.” (The Brain from Inside Out、p.10)

*23:マイクロプロセッサの話はブザーキの本には出てこない、筆者が追加した説明。

*24:デヴィッド・マーは、見事なまでに真逆のことを言っている。”trying to understand perception by studying only neurons is like trying to understand bird flight by studying only feathers. It just cannot be done. “(David Marr, Vision)一方、ブザーキは、マーの戦略は視覚などの限定的な領域でしか成功しないと言う。

*25:「超低電力SLAMへ一歩、東芝が「海馬」チップ実現へ」https://tech.nikkeibp.co.jp/atcl/nxt/column/18/00001/02319/

*26:その意味で、「海馬の計算=SLAM」もミスリーディングなアナロジーの一つと言える。

*27:正確には、一つの「場所」を表すのは一つの細胞ではなく、(ブザーキの推定では)150~300個の細胞からなる「アセンブリ」である。したがって、「a→b→c→d→e」は「アセンブリのシーケンス」となる。

*28:https://buzsakilab.com/wp/

*29:本記事を事前に読んでいただいた方の一人からは、ブザーキの立場は「仮説駆動型」に対する「データ駆動型」のアプローチの提唱とみなすべきではないか、と指摘された。ブザーキ自身は「内から外へ」というスタンスに独自性を主張するが、たしかに「データ駆動型の神経科学」と位置づけたほうが正確なようにも思われる。

*30:なお、マーの枠組みの代替案を掲げるのではなく、それを拡張することで限界を乗り越えようという立場もありうる。日髙昇平氏の論文はマーの「計算理論」の意味を拡張することを提唱している。日髙昇平. "最適化を超えた認知科学の新たなパラダイムに向けて: Marr の情報処理の三水準の再考." 認知科学 24.1 (2017): 67-78. https://doi.org/10.11225/jcss.24.67

*31:意識の情報統合理論(IIT)やカール・フリストンの「自由エネルギー原理」などを念頭に浮かぶ。

*32:本記事ではあくまで脳研究を「科学」とみなし、その重要なゴールが「脳の理解」であることを前提にしている。しかし、当然「脳の治療法の開発」や「汎用ロボットの開発」を目的とした脳研究もありえ、それらはむしろ「医学」であり「工学」だろう。また、「科学」に限っても、その目的は「理解」だけではなく、また他の目的に至るために必ずしも「理解」を経由する必要はないかもしれない。とはいえ、「脳を治せること/脳のような機械をつくれること」は「脳を理解すること」と密接に結びついており、前者を後者の必要条件だとする立場すらありうる。たとえば、川人光男氏は次のように述べている(川人光男『脳の計算理論』産業図書、1996年、pp.9-10)。「著者の〔計算論的神経科学の〕定義は次のようである。脳の機能を、その機能を脳と同じ方法で実現できる計算機のプログラムあるいは人工的な機械を作れる程度に、深く本質的に理解することを目指すアプローチを計算論的神経科学と呼ぶ。ここで断っておかなければならないのは、計算論的神経科学の真の目的は人工物を作る工学ではなく脳を理解する理学ということである。ただし、脳を理解するレベルにも物質などハードウェアレベル、機能局在の場所のレベル、定性的、概念的な理解、文学的な理解など実に様々な深さがありうる。そこで最も客観的でかつ深いと思われる、同じ原理で同じ機能を果たす人工物を作れるという制限をおくのである。深い数学理論や大規模なコンピュータシミュレーションに基づく理論やモデルであっても、脳が示すある側面を単に再現するだけ、あるいは記述するだけといったものは、この定義では計算理論ということにはならないのである。もちろんこの定義が狭すぎる、厳しすぎるという立場もありうる。しかし著者はこの精神がなければ本当に脳を理解することにはつながらないと信じている。」川人氏の言うように、「何ができるか」と関連づけて「理解の仕方」の特徴を考えることは的外れではないと思う。

*33:加えて、医学応用にも資するかもしれない。精神障害の理解と治療にも計算論的な脳の理解が必要だとする「計算論的精神医学」が近年注目されている。

*34:と同時に、倫理的問題もはらむ。https://rmaruy.hatenablog.com/entry/2019/08/11/231217

*35:Chang, Hasok. Is water H2O?: Evidence, realism and pluralism. Vol. 293. Springer Science & Business Media, 2012.

*36:チャンの言葉では「科学的実践の体系」(system of scientific practice)

*37:「脳理解の多元性」というアイディアは本記事筆者の発案ではなく、ジョン・クラカワー氏らの総説論文に負う。この論文では、本記事とは違う仕方で脳理解の多様な目的を提示し、それが多元的であるべきだとしている。ただし整理の仕方もその力点も、本稿とは異なる。Krakauer, John W., et al. "Neuroscience needs behavior: correcting a reductionist bias." Neuron 93.3 (2017): 480-490. https://www.sciencedirect.com/science/article/pii/S0896627316310406

*38:田中宏和『計算論的神経科学:脳の運動制御・感覚処理機構の理論的理解へ』(森北出版、2019)https://note.mu/morikita/n/nc41cd79166f0

*39:もちろん、本記事の内容の不備の責任はすべて筆者個人にあります。