一匹では小さな小魚でも、仲間と集まれば天敵をも恐れない大魚となる。童話「スイミー」の逸話だが、同じような現象が自然界に見られるのである。我々人間も例外ではない。バラバラの個人である私たちは、寄り集まって国家を成している。このように自然界にも人間社会にも共通して見られる「群知能」の原理を究明し、新時代の情報ネットワークの構築に活用しようと研究しているのが、栗原教授である。我々の生活のあらゆる面に応用できる群知能の奥深さ、そして世界中で加速するAI競争の中で日本がとるべき戦略について、栗原教授にお話を伺った。
「群知能」とは何か?
Q:現在の研究についてお教え下さい。
人工知能の研究をしています。その中でも「群知能」や「知能創発」といった分野で研究を行なっています。群知能とは何かというと、群れのことです。人を含め、全ての知能は群知能であると言い切ってしまえるのです。
Q:群知能とは、どういったもののことですか。
例を出しましょう。自然界で見られる、蟻の行列や、イワシが群れを作って自分たちを大きく見せること、そして鳥のV字飛行などが典型的な群知能です。あるいは、私たち生物の体もそうです。私たち人の体は実は60兆個くらいの細胞の集まりだと言われており、細胞以外のものはありません。しかしそのように細胞が寄り集まると、人のような高い知性を創発するシステムとなるのです。そして、知性を生み出す中枢である脳に至っても、脳神経細胞という細胞の塊にしか過ぎません。
私たちは普段話したり、ものを考えたり、見たりしていますが、例えばものを手に取るときには、手に取るという指令が脳から発せられて、それが筋肉を動かし、ものを取っているのだという言い方をします。だからある意味では脳はコンピュータでいうCPUに相当しており、人間をコントロールしているのだと言えます。このように脳は人間の中心であり、脳がいろいろなことを命令しているから人体は動くと言えるでしょう。
Q:その脳はどのようにできているのでしょうか。
脳の中には大脳があり、小脳があり、様々なパーツがあり、全部で約2千億個もの神経細胞からできていますが、リーダーとして統合している親玉のような存在がいないとおかしいと思いませんか?ところがその親玉なる存在はいないのです。脳を分解していくと、結局は一個一個の小さい細胞しかありません。この約2千億個の小さい細胞は、それぞれつながっている、言わばネットワークのおばけです。脳はそれだけなのです。それなのになぜ、このようにものを考えたりできるのでしょうか?
この問題について考えるために、冒頭でお話しした蟻の例に戻ってみましょう。夏の公園でふと足下を見てみると、蟻が餌と巣の間で行列を組んでいるのをよく見かけますね。私たちから見ると、「餌と巣の間を最短距離で結び、効率よく餌を運んでいるな。蟻は小さいのにチームプレーができて、賢いじゃないか」と思えます。ところが、一匹一匹の蟻は、自分がそのように列を作っているとか、はたまた皆と協力して効率よく餌を運んでいるなんて思っていません。蟻には指揮官などいませんが、一人一人が決められた仕事をしているだけです。しかしその様子を上から見てみると、あたかも全員がある目的のために動いているように見えるのです。そしてそれが最短経路を作っており、そのお陰で餌を効率的に運べています。だからこそ蟻は自然界で生き残れているのです。言い換えれば、「群れが知能を創発している」のです。
蟻一匹一匹の能力は小さい。ですが、大量に集まり、その上触覚で情報をやり取りしたり、歩きながら地面に匂いを付けたりします。それにより「仲間の蟻がどこを通ったか」という情報が残るので、他の蟻が「あっ!この匂いは餌の匂いだ」と気づき辿っていくという、とても単純な仕掛けがあるのです。つまり、個々の蟻はごく簡単なルールに基づいて行動しているに過ぎません。しかし非常に数多く集まると、最短経路を実現したように、その個々の能力を超えたことが生み出されます。これを、群れが生み出す知能、「群知能」と呼ぶのです。
Q:なぜその群知能を研究しようと思われたのでしょうか?
結局は、脳にしても人間にしても、一個一個の細胞でできています。そして、例えば胃袋を作っている細胞は、まさか「自分は胃を作っていて、食べ物を消化するために頑張っているのだ」なんて思ってはいません。一個一個の細胞は淡々と、生きるためのことをしているだけです。脳も同じで、ただ神経細胞が集まっているだけであり、それは他の細胞と繋がっていて、電気信号が来たら流すといった、バケツリレー的なことしかしていません。それだけなのですが、ひとたびその細胞が集まると、人間というひとつの知的生命体になっている。この仕組みを知りたいと思いませんか?
この疑問は、「知能とは何か」という本質に繋がっています。今度は社会に目を向けてみて下さい。一人一人の人間が勝手に動いていますよね。また、よく「政府が」「国家が」という言い方をするので、あたかも「国」や「政府」という実体があるように感じますが、そんなものは実はどこにもないのです。あるいは「日本」「アメリカ」「イギリス」「フランス」……と言うと、「国」という存在があるように思いますが、そこにあるものは、国民だけですよね。「国」「社会」と言っても、そこにいるのは人間という末端の存在だけ。つまり、人間というそれぞれの生き物が動いていて、その人間たちは、自分が生きるために活動しているだけなのです。しかしその人間が集まると、「世論」ができたり、いわゆる「コミュニティ」ができたり、「国家観」「国民性」のような上部の集合体が生まれます。
さらに、一個一個の人間が営む中で生まれてくる「国家観」なるものが、「国」なのだとすると、その「国家観」をどう動かすかが「政治」ですね。言い換えると、「日本をどうしていきたいか」と考えるときに、一人一人の国民をどうするかという話ではなく、国民全体から創発される日本のありようを左右しようとしている。それが「政府」です。あるいは、ある人に「より良く生きなさい」と言ったとき、それは人に対して言った言葉であり、一つ一つの細胞に対しての言葉ではありませんよね。
つまり細胞から成る人間がいて、人に対する話を個々の細胞にしても意味がないのと同じように、人が集まってできる国に対する話を一人一人の国民にしても意味がないのだと思います。しかし、人間が「強くなりたい」と考えたとき、結果的には細胞レベルから強くならなければいけませんよね。これに対して、例えば部品やパーツなど、何のために必要か当然分かっているものがあります。車のパーツが必要なのは走るためです。そして車全体の動きを速くしようと思ったらどこのパーツを改良すればいいかということまで、全て分かっているのです。
しかし勝手に動き回っているものを変えるのは、難しいですよね。一個一個の小さいものが集まることによって出来る集合体を良くしようと思ったら、小さいものから良くしていかなければいけない。けれども、蟻や人の体といったものは、一個一個の部品が勝手に動き回っています。さらに個々のパーツは全体における個々の役割を意識してもいません。そういう生き物ですから、変えようといっても、どうすればいいのか分からないのです。
群知能を変化させる現在において唯一効果的な方法は「進化型手法」です。ダーウィンの進化。なぜ進化するのかと言うと、それは生き残るためです。言い換えれば、私たちが死ぬと、私たちを作っている細胞も死にますよね。そのため細胞は細胞自体の進化と、細胞同士のつきあい方を進化させることで、生き残りを目指すのです。また、蟻といっても、その種類や生息する環境により、創発され知性は様々です。例えば、アフリカにいる「葉きり蟻」は、ひたすら旅をする蟻です。彼らはまさしく農耕をする蟻であり、葉っぱを切る蟻、運ぶ蟻……というように全て役割分担がされています。しかし蟻にはリーダーが存在しません。つまり進化をする中で、生き残るために、たまたまそういう蟻たちが生き残ったのです。
同様に、政治によって国民を良い方向に導こうとすると、それぞれ各自の生活を営む国民を動かさないといけません。その場合、国民一人一人の行動に制約を与える法律は重要ですね。なぜなら法律を決めると人間同士の交流が変化し、結果的に国民の行動の総体としての国が変わりますから。 それは、車やテレビなどの製品を設計する流れとは180度異なります。我々が物を作る時、まずは作る物の仕様を決め、それを組み立てるための部品を設計します。しかし、あるべき国の仕様を決めたとしても、それをどのように実現すればよいかを求めることは難しい。そのような方法が分かっていれば世界は現在のようにいろいろな問題を抱えてはいないでしょう。蟻の例でも、一匹一匹を改造して、全体としての動きを変えるためには進化以外の方法は分かっていません。それを知ることが群知能や創発を研究する人の野望なのです。
Q:群知能を解明するとどのようなことが可能になるのでしょうか。
将来的には、脳のようなコンピュータだって作れるかもしれません。けれども、そもそも脳には神経細胞しかないのに、なぜ人間は喋ったり考えたりできるのでしょう。不思議ですよね。さらに不思議なのは、脳はある意味では電気回路と似たようなものです。しかし、パソコンを解体しようとして回路の線を一本でも切れば動かなくなってしまいますが、人間の脳を作る細胞は20歳を過ぎると早くも減りはじめ、そして少し頭をぶつけたりしたら大量に細胞が死んでしまいますが、それでも脳は正常に活動しています。おかしいではありませんか。人間の脳をハードウェアだと考え、そのハードウェアが動くことによって意識や自我ができているのだとしましょう。するとその電気回路は日々変わっていることになるのです。毎日想像以上に多くの神経細胞が減っているにもかかわらず、昨日も今日も「自分は自分だ」と意識が安定しています。言い換えるなら、電気回路が変わっても、裏蓋を開けて線を切っても、OSが動いているのです。このシステムもまた、私たちが科学的に作ったものにはありません。
要するに、脳の細胞は徐々に死滅、劣化していきます。それでも自我や意識を一貫して維持できるように進化してきたのが、私たちの脳なのです。劣化していくようなハードウェアにおいて、いかにして一貫性のある自我を作るか。いかにしてその一貫性を保てるのか。そういうシステムをどう作るかが重要です。国も国民によってできていますが、国民は日々亡くなり日々生まれています。つまり日本という国を維持している国民は毎日変化しているにも関わらず、日本は日本です。ということは、私たちが何か国民を維持するためのシステムを作っているということなのです。
結局、そういうシステムのカラクリを知るということは、人を知る、人が作る社会の仕組みを知るということと同じことです。ですから、そういうシステムを作るためにはもちろん、ゼロから組み立てるための研究も重要ですが、一方、既に存在するシステムを題材として、それを制御する方法を考える方法も有用です。インターネットや、インターネット上での新しいメディアであるSNSなどのソーシャルメディアがよい題材です。そうした研究に、一環して取り組んでいます。
群知能や創発を活用した複雑システムの再現
Q:「群知能」や「創発」の研究とは、具体的にどのようなものなのでしょうか。
まず、脳にしても社会にしても大規模で、かつ複雑です。神経細胞にしても人間にしても、膨大な数がいて、脳の中ではシナプスで絡み合い、人間の場合は人間関係で繋がっています。そうしたものをどのように理解し、制御すればよいのでしょうか。こういう複雑システムは、社会システムもネットも脳も全て一緒なのです。この複雑システムの特徴は、人間・神経細胞・蟻など非常に多数の末端のパーツがいることです。そしてそれらは命令されて動くのではなく、大量に集まり、自律的に動いています。そしてもう一つの特徴は、動的だということ。つまり、生き死にがあり、それによりネットワークも変わります。人間であれば生活、成長していく過程で人間関係がどんどん変わっていきますよね。要するに静的ではないのです。
複雑システムを理解しようと思うと、いろいろな分野の知識が必要です。5年くらい前までアプローチしていたのはマルチエージェントでした。 エージェントは人間や蟻などの自律的行動主体を指し、マルチは複数を意味します。どういうものかと言うと、人工知能のような働きを持つものが複数存在するシステムにおいて、人工知能同士をどのように連携させることでシステムとして効果的な運用を可能とするかがテーマです。「三人集まれば文殊の知恵」と言いますが、まさにそうなのです。単に集まるだけではだめで、集まり、そして連携しなければいけません。それでは、どのようにお互いに関係し合うか。そのためにはネットワークが重要です。エージェントもお互いにランダムに繋がればよいというわけではありません。例えば脳の神経細胞は適当に他の神経細胞と繋がっているわけではないように、繋がり方には何か特徴があるのです。
人間もそうです。例えば、知り合い関係、すなわち友人ネットワークについて考えてみます。日本には一億人以上いますが、お互いに全員と知り合いというわけではなく、一人一人の人間が親しい知り合いになるのは多くても200〜300人くらいではないでしょうか。とても局所的な関係です。 ところが、「意外と世の中は狭い」と言います。例えば、北海道に住んでいる適当な人と、沖縄に住んでいる適当な人を二人選んでも全くの他人だと思いませんか。しかし、実はそうではないのです。この二人をよくよく調べて、友人の友人を辿っていけばたかだか6人くらいで意外にも繋がるのです。これを「6次の隔たり」と言います。つまり、一人一人は数百人くらいの閉鎖的な友人関係しか持っていないにも関わらず、友人の友人を次々に辿っていくと適当に選んだ2人であっても、友人の友人という関係においては比較的近い関係にある可能性があるのです。
実は、脳も同じ構造を持っています。一個一個の神経細胞は周りとだけ繋がっていますが、繋がっている神経細胞を次々に経由していくと、5個か6個の繋がりで、2千億個の神経細胞のどれにでも行けるのです。この構造をスモールワールドと呼びます。つまり、一個一個の神経細胞は単に集まっているのではなく、そういうタイプのネットワークとして組まれているからこそ意味があるのです。ですから私は「神経細胞とはどういうものであるか」「それらがどう繋がっているか」という両面を研究しています。
Q:「複雑システム」の解明が重要なのですね。
人工知能の歴史においては、マルチエージェントの研究はかなり以前からありましたが、ネットワークの構造、適切な繋がり方の研究は、20年前くらいに出てきた比較的新しい話です。この二つの分野が私の研究の主な背景です。私は大学院卒業後NTT基礎研究所に入り、その後大阪大学に転職し、それから今に至ります。最初の研究は、AI、マルチエージェントの研究でしたが、個々のAIパワーがどのように強くなっていくのかに興味をもち、その中で徐々に複雑システムやネットワークの分野に入っていきました。また、スモールワールドという構造を発見したダンカン・ワッツ(現・Microsoft Research)の本の翻訳などもしてきました。
生物というシステムは高い適応力を持ち、ノイズに強く、拡張性があると言われていますが、そうした漠然としたヒントから、少しずつ複雑システム、ネットワークの重要性が分かってきたのです。そして現在では脳や汎用人工知能の研究に応用されています。最近騒がれているディープラーニングも脳の仕組みを真似ています。ディープラーニングにおける一つ一つのノード、つまりディープラーニングを構成する個々のニューロンは何をしているのかというと、バケツリレーのように信号を伝搬させるだけです。つまり、高い認識性能を発揮するディープラーラーニングも、群知能の一種だと言えます。当然、人の脳の方がディープラーニングよりもっと複雑です。
ロボット研究から
Q:それら複雑システムをずっと研究してこられたのですか。
最初は、ロボットのようなエージェントが、与えられた目的を達成するためにどのように行動するかを決定するためのプランニングに関する研究をしていました。私たちは頭でいろんなことを考えていますよね。例えば、学校の先生ならば、授業をしながら、「トイレに行きたくなってきた」と思ったり、今日の夜の予定を考えていたり、いろいろなことを考えています。普段私たちの思考の中には様々な目的がうごめいているはずです。しかし同時に、そうした多くの目的を上手く、適切にさばいています。例えば、非常にトイレに行きたくなって、もはや緊急状態に至っては、その行動を優先します。つまり、それぞれの目的の緊急度、いつまでに達成しなければならないのかを判断して、脳がそれぞれを振り分けながら器用に処理しているのです。
Q:複数の思考が同時・並列に処理されているのですね。
NTTにおける初期の研究では、それと同じことをロボットにさせようと試みました。状況に応じて可能な限り好ましいプランを生成させるのです。そのために、脳の内部にたくさんの小人をイメージしました。彼らはミニサイズの脳であり、様々なゴールを担当しています。そして「自分のタスクを達成すればいいや」ということしか考えません。ある者は「トイレに行きたい」ということだけを、別の者は「お腹が空いた」から何かを食べることだけを考えるのです。それらは勝手に自分の身体を動かそうとして、身体を動かすこと担当の人にお願いします。そこでお願いされた側は、いろんな人から一番お願いされた行動をとろうとします。例えば、トイレに行きたい者はまず足を動かすべきだと言います。そしてお腹が空いた者もちょうど足を動かしたいと思っている。そのようにたくさんの者が一致した結果、「足を動かす」という行動をとるという具合です。ところが緊急度はそれぞれのタスクごとに違います。食べたい者は、すごくお腹が空いていても一食抜いたくらいでは平気です。しかしトイレに行きたい者は、トイレに行かなければ大変なことになってしまうので、四の五の言っていられなくなります。
そのように、四の五の言っていられない行動を優先的に実現する仕掛けのロボットを作っていました。よって、この時に研究していたのは、まだネットワークではなく、あくまでもAI。複数のエージェントがどのように連携して行動すれば、全体としてうまく機能できるかという試みでした。複数のAIの連携の仕方としては、例えば会社のように、リーダーがいて、モジュールの中でそれぞれの意見を聞いて調整する仕組みです。また、リーダーはいないが、AI同士がお互い入念に話し合って合意を形成する仕組みも考えることができます。先述の群知能のような仕組みも考えられます。一個一個のエージェント・AI同士は話し合いもせず勝手に動きます。勝手に動き回りながらも、蟻が匂いを付けるように、何らかの決まりに基づいているのです。最初の連携方式は中央集権型、2番目は直接強調型、そして最後は間接強調型と呼びます。
こういった3つの連携の仕方をどのようにスイッチングし、使い分けていけば、システムが上手く動くのか。そういう研究でした。おそらく、リーダーがいて指令を出す方法が一番効率的ですよね。しかし子分が増えてくると、中間のリーダーがパンクしてしまいます。そしてAI同士が直接的に協調する方法でもやはり、数が多すぎると結論が出なくなってしまいます。最後の、一つ一つのAIが勝手に動く方法だと、最適性は保証されませんが、安定した動作は期待できます。そのため、時間の決められた中で破綻しなければ最初の二つを使い、破綻するのであれば三番目にスイッチングしよう。そういう原理で動くものを作りました。それが最初の頃の研究です。
Q:研究環境の変化に応じて、内容も変化していったのですか。
はい。2009年に阪大に行くと、ネットワークに関連した研究に徐々にシフトしていきました。その一つが、「繋がり方が似ていると中身も似ている」という話です。例えば、東芝、パナソニックといったメーカー企業のホームページは大体、会社の説明があって、製品についてのページなどがありますよね。扱っている製品が似ていると、ホームページの内容や、リンクの貼り方も大体似てくるのです。これは趣味のことを書くユーザーのホームページであっても、例えば車好きの人がみんな貼るリンクがあるように、似てきます。つまり、コンテンツが似ていれば、どういうことを書いているか具体的に見なくても、そのwebサイトがどういうサイトにリンクを貼っているかを見るだけでいいのです。リンクの貼り方、要するにネットワークの形を見て、その形が似ていれば、大体中身も似ていると言えます。
この考え方の利点は、リンクの情報ならば簡単に取れるということです。ところがwebサイトの中身を見ようと思ったら、書いてある文字を全て解析しなくてはならず、計算パワーなどコストが非常にかかってしまいます。そこで、まず貼ってあるリンクを見て、似ていたら中身を見るというやり方にすれば、検索がより効率的になるでしょう。
そして次の研究では、そのようなネットワークの構造を見て、小泉元首相が取り組んだ郵政民営化に対して賛成か、反対かを調べる仕組みを開発しました。通常ならばコンテンツを調べるのですが、そうではなくて、まずはネットワークの繋ぎ方だけから、分類しました。そうすると繋がり方の特徴だけで大きく2つのグループに分けることができました。そして、そのコンテンツの中身を見ると、それぞれが賛成派と反対派であることがわかり、その後の分析が容易になりました。
ちょうどそうした研究に取り組んでいるさなかに、ユビキタス情報通信の話題が出てきました。複雑なシステムで様々なものが関係しあっているという仕組みは脳や人間社会に見られますが、その研究の中にIoTやビッグデータの兆しが見えてきた頃でした。
例えば、部屋の中に多くのセンサーが仕掛けられていて、センサーネットワークを形づくっているとしましょう。その中で人間が行動すると、どのように動いたか分かるようにしたのです。すると、後はビッグデータ解析をすれば「ここに座っている人はこんな行動をする」という行動パターンが分かります。そんな環境の中で、廊下にバナナの皮が落ちていたとします。そのため、走っていくと転ぶということが予測できたとしましょう。
一般的なセンサーネットワークは、センサーを設置して、そこから出てくる情報を使って世の中がどうなっているかを予測するものです。予測をする話はよくあるのですが、上の場合、予測をしただけでは結局バナナの皮を踏んで転んでしまいますよね。転ぶと予測して、「ああ、やっぱり転んだ」と思ったって、役には立たないのです。このような場合、やはり予測して止めなければ意味がありません。重要なのは予測した上で行動することです。すなわち、転ぶ直前にバナナがあることを教えるとか、走ることをやめさせるといったインタラクションを行う必要があります。
例えば、おばあちゃんとおじいちゃんの夫婦がいて、天気のいい秋晴れの昼下がり、おばあちゃんが「おじいさん、お茶ですよ」とそっとお茶を持ってきてくれます。すると、おじいちゃんは「気が利くねえ」と言うでしょう。よくある話ですね。しかしおばあちゃんはどうしてこのような行動ができたのでしょうか。それは、おじいちゃんとおばあちゃんが離婚をせずに長く一緒に暮らしてきたことによって、お互いがどういうことが好きかを把握しているからです。お互いの好きなことを見抜いているため、「おじいちゃんはこういう時にお茶が飲みたいんだ」と予測をします。予測しただけではだめで、予測をしたからこそ、そのタイミングでお茶を出してあげます。まさにその時お茶を出したことによって、おじいちゃんは「ちょうどお茶が飲みたかったんだ。気が利くねえ」と言うでしょう。
ところが、タイミングを間違えた場合、つまり予測を間違うと「お茶なんか飲みたくないよ」。はたまた今度お茶を飲みたいときに出せなかったら「いや、さっき飲みたかったんだよ」。つまり予測できた後のタイミングが重要です。いつ、どのように、どのタイミングで、適した行動をすれば良いかを考えなくてはいけないのです。
そうした研究をしたのが、大阪大学に所属していた時です。総務省からの受託研究で複数研究拠点メンバーと研究を行ないました。この研究には、先ほどの蟻の話も応用したのです。センサーをいろいろな場所に貼付けるときに、付ける場所を予めいちいち設定するのは面倒ですよね。IoTがますます普及して、一般家庭にこうしたセンサーを設置すると考えると、ガス・水道・電気はいちいち設定せずに、使いたい時にふっと使いますね。IoTのセンサーだって、一般家庭に買ってきて付ける際に、何番のセンサーはどこにつけて、何番と何番は接続するといった細かい設定はめんどくさくてやりたくないではないですか。センサーを買ってくるだけ買ってきて適当に設置したら、あとはセンサーが勝手に、自分の設置された場所、接続している他のセンサーを把握して、結果的にその場の住人の動き方などの情報を読み取ってくれないと、やってられませんよね。それを可能にする研究をしたのです。
つまり、センサーをつけてその中で生活すれば、徐々に家の中での動きが見えてくるようにしました。そこに蟻の行動を使ったのです。蟻は匂いを付けて動きます。それを使うと、人が何回も通るところには匂いが付くので、跡が残りますが、たまにしか通らないところは跡が消えていくでしょう。その結果、人が確かに生活したところだけに匂いが残って、最終的にルートが分かるはずだと考えたのです。実験したところ、正確にルートが浮かび上がるのです。
では今度は、どんな行動をしたのかを解析します。研究室での日常生活に重要なコーヒーメーカーを例としてみましょう。これはあくまで私たちの実験環境の範囲内なので洗濯機などは出てこないのですが、様々な家電をどう使っているのかという情報を収集していきます。すると、ある人の行動を集計して、「この人の行動においては、コーヒーの確立が何パーセントだ」と結果が出てくるのです。それが分かったら今度は、そのタイミングでコーヒーメーカーを動かすのが良いと分かります。
具体的には、人が行動する環境の中で、天井にプロジェクターを付けていて、床に投影されるようにしました。つまり、人が動いていってドアを開けて、コーヒーメーカーのある部屋に行きたいというシナリオです。コーヒーメーカーには温度センサーが付いているので、コーヒーが入っている時は温度が高いが、入っていない時には温度は低くなります。そしてコーヒーメーカーは全自動エスプレッソマシンなので、入れるまでに時間がかかるのです。そこで、席を立った時にコーヒーメーカーのセンサーの温度が高ければ、コーヒーが入っているということを投影してあげます。ところが、センサーの温度が冷たければ、ドアを開ける直前にコーヒーは無いと知らせるので、その人がコーヒーの部屋に行く必要は無くなります。
この場合、そういうシステムを予め作ってプログラムしておけば簡単にできますが、それでは面白くありませんよね。そこで、ある人が普段どのように同生活するかを一定の期間にわたり取り溜めていくのです。すると「ある時間に席を立って、コーヒーメーカーの部屋まで行き、しばらくすると帰ってくる」と分かります。つまり、コーヒーメーカーの温度が高い時には、そこでコーヒーを飲む時間があるので、一定時間のちに席に戻ってきます。ところがコーヒーメーカーの温度が低い時にはコーヒーは無いので、行っても「あ、コーヒーは無いんだ」と帰ってきます。つまり、温度が高い時には何かそこに行く意味があるから行っているのですが、冷たい時には意味が無いからすぐ帰ってくる。こういったことを積み重ねていくと、人間が「センサーの温度が低い時には、コーヒーが無いんだよ」とインプットしてあげなくても、行動パターンからそうした事実が解析されてくるのです。
この時に、一つ一つのセンサーの繋げ方に、群知能らしい方法を使いました。つまり人間の行動に従って仮想の蟻を動かすと、個々の蟻はセンサーが反応する順番に動くだけなのに、全体としての動きが見えてくるのです。私たちが群知能をセンサーネットワークに応用したように、最近は群知能のデータマイニングに使おうというアイディアを紹介する洋書も出版されていて、翻訳をしました。
Q:大学の研究機関以外とも協力して開発を行なうことはありますか。
そうですね。企業とも、群知能の研究を応用した開発を行なっています。例えば、カーナビで表示される渋滞情報のシステムです。その渋滞情報を集める方法には、VICSとプローブの二種類があります。プローブはカーナビではありません。F-1カーに付いている通信機能と同じ機能であり、位置データや速度などの情報が全てセンターに送られるのです。実はトヨタやホンダは、渋滞情報を調べるためにプローブからの情報を使っていて、トヨタの車に乗っている人は、付近の道が混んでいるかどうかが、他のプローブカーの情報で分かります。ところが、レクサスなどのプローブカーは高価ですし、そうは走ってないですよね。
また、都市部から離れれば離れるほどプローブカーは少なくなります。一日に一度くらいしか走ってくれないのでは、渋滞情報としての信頼は全くありませんよね。一方のVICSも、全ての道路の情報を収集しているのではないので、実は一部の渋滞情報しか把握できないのです。そこで、道路を表示した画面上を、青がVICSのサービスが提供されているエリアで、緑がプローブと色分けします。すると青と緑が重なるエリアもありますが、VICSの情報もプローブの情報もどちらも無い道路も結構あるのです。その部分の情報はどう収集すれば良いでしょうか。センサーが付いているエリアの情報は提供できても、他の情報が欠けているのでは、面白くありません。
しかし道路は繋がっているではありませんか。つまりVICSもプローブも繋がっているのであれば、その道路と繋がっている部分だって予測できるはずです。実はそれを実現するためにも、また蟻の原理を使ったのです。車を蟻だと考えました。それぞれの蟻は停まっている時は動かないのですが、動く時のフェロモンの出し方を変えて、ずっと匂い、この場合は排気ガスを出しっぱなしにしていることにしたのです。排気ガスは次第に道路を伝わって、伝播していきます。そのため、VICSやプローブが情報を出しているところから匂いを出していけば、どちらも無い道にも伝わるのです。そして匂いが薄くなればなるほど、情報が薄くなっていきます。このように、情報を伝播させていけば、全ての道路の渋滞状況が把握できるようになるのです。実用化にはまだ至っていませんが、将来はこうした技術が実用化されていくのではないでしょうか。
あとは信号機です。現在、信号機同士は連携していません。しかしコンピュータを入れて、上り・下りとも混んでいる信号機が隣の信号機と連動すれば、スムーズに流せるようになるでしょう。そういう取り組みを行いました。車が信号待ちをせず走るためには、いいタイミングで信号が青に変わる必要がありますよね。この研究にはネットワークの要素は無いのですが、マルチエージェントの連携の技術を応用しました。
Q:実社会における問題解決に貢献しそうな分野ですね。
また、電気通信大学に赴任してからは、脳や社会システム、神経細胞にシフトしていきました。最近話題の全能アーキテクチャなどにも分野を広げていきました。そして、東日本大震災が起きてしまい、それを契機に防災・減災について研究を行なったのです。震災ではデマ・風評が流行ってしまいましたよね。その広がり方を解明するために、病気の感染を手本にしました。冬になってくるとインフルエンザが流行りますが、インフルエンザは咳をするとウイルスが拡散し感染します。
それが情報の場合、自分しか知らない情報を人に話し、その人が情報を知ることが「感染」です。しかしその状態ではまだ「潜伏」です。その人が次の人に話すことが、次の感染なのです。そのように考えると、デマや噂の拡散は病気の感染のダイナミクスとほとんど同じです。違うのは、ウイルスの場合自分の意思に関わらず発病しますが、情報の場合、その情報を得た人間が次の人に言うか言わないか、判断が入る点です。それ以外は同じはずなので、情報源を見たことのある人、デマ情報を流した人、訂正した人……と分けて、病気の感染モデルのようなモデルを作りました。それでシミュレーションをすると、大体再現できることが分かりました。つまり我々のモデルが正解の可能性があったのです。他に正解のモデルがあるかもしれませんが、一つの可能性を示していることが分かりました。
ではこのモデルが正しいのであれば、どのようにデマの感染を早期に阻止できるのか。そしてどうしたら訂正の情報を早く拡散することができるのか。その研究のために、今度はスモールワールドの考え方を利用しました。例えば普段病気にかかると町医者にかかり、場合によっては入院しますが、ウイルスを持っていたらそこにいる人にはもれなく感染させますよね。ところが町医者なので、感染は近隣の住人に限られます。そのためそこだけ閉鎖・隔離してしまえば収まる可能性があります。それでは、成田空港などの国際線で病気になり、入院したらどうでしょうか。同じように入院しても、近くのベッドにいるのはアメリカ人かもしれませんし、カナダ人かもしれません。そのように他の国から来ている人に感染すると、潜伏期間に感染者は帰国し、自分たちの国で発症します。一気にパンデミックが起こるのです。
つまり、病気や情報は、どこで感染するかによってそのあとの展開が全く異なります。ローカルで起こるのならまだいいのですが、幅広く友人同士を繋いでいる人間が感染すると一気に拡散するのです。この仕組みは脳も同じで、もしも脳の神経細胞が全てお互いに繋がっていたら、脳の局所部位でのちょっとしたパニックであっても、すぐに脳全体がパニック状態になってしまうかもしれません。しかし、実際には脳の神経細胞はモジュール化されているので、全体に拡散するのにも時間差が生じることになり、エラー状態が拡散する前に信号を遮断できるのです。つまり、ネットワークの全部が全部一つの塊ではないが故に、私たちの安定性が保たれていると言えるでしょう。様々なネットワークにおいて、個々の要素がローカルに繋がりながらも、全体とも繋がっているので、その絶妙なバランスがいいあんばいを出しているのです。
世界的なAIブームの渦中で日本には何ができるか
Q:絶妙なバランスで保たれているのですね。
そうなのです。そうした維持できるメカニズムも重要だと思います。そして現在、電通大で4年目ですが、3度目のAIのブームが来ています。そのため、あちらこちらでAIの拠点ができてきており、電通大も拠点を作ろうと言う話が立ち上がりました。それで人工知能先端研究センターを設立したのです。背景にあるのはやはりグーグル、強大なアメリカのパワーへの懸念です。日本でも多くの拠点ができていますが、グーグルの後追いをするのであれば、全部足し合わせてもかなわないでしょう。数でも質でも量でも勝てません。グーグルが一年間に使う費用は一兆円とも言われており、桁違いの額なのです。
昨年2月にはアルファー碁も話題になりましたが、ああしたものを見せられると、まさしく巨人だと感じます。同じことをしていてもなかなか太刀打ちできないでしょう。かといって、究極の人工知能もまだできてはいません。ここで、全てグーグルにとられてしまったらゲーム終了となってしまいます。だからこそ、一つのピースでもいいからとっておきたいのです。なぜなら「これが無ければ完全な人工知能は完成しない」と言えるピースを持っていれば、日本もアクティビティが出せるからです。そして、そのピースを得るために不可欠なのは多様性です。よってたかって似たような研究をするよりも、いろいろな人がいろいろな場所で取り組んだ方が良いアイディアが出ます。そのため、一カ所に集めるよりも、いろんな拠点がある方が好ましいのではないかと考えました。バラバラにあるからこそ、それぞれの色が出せるのです。
それでは、私たちはどういう色を出そうかと考えたとき、汎用性の高い人工知能の開発を軸にしようとアイデアが浮かびました。これまでのAIの例としては、東京医科科学研究所の治療で活躍した人工知能「ワトソン」の話があります。ある難病の患者さんがいたのですが、病名が分からず、打つ手もありませんでした。そこで人工知能「ワトソン」を導入し、2500万件の論文を学習させたところ、病名も治療法も突き止めたのです。そして「ワトソン」が提案する通りに治療したところ、患者さんは治って退院したそうです。それまでの処方を続けていたら亡くなっていたかもしれないと報道されていました。人工知能によって人命が救われたのです。
これは、人間が処理できないようなレベルの膨大な情報を集めた中から、新しい事実を発見するというタイプの人工知能です。つまり、人間ができない部分は徐々にできるようになってきたのです。しかし、汎用人工知能はもっと人間に近い存在です。我々の生活する社会に入ってきて一緒に生活するようなAIを想定しています。人間は一つのものでも器用に様々な使い方をしますが、人工知能はそうした応用ができませんでした。応用させるためには、やり方を教えなければなりません。しかし教えていたらもはや応用ではないでしょう。つまりAIには創意工夫ができないのです。私たちにとって、いろいろな用途を考えて応用したり、道具を組み合わせたりするのは当たり前ですが、まさにその分野が情報処理技術の難題なのです。一方で人間が苦手な、複雑な表計算や囲碁、将棋などは、人工知能にとってそもそも得意です。
Q:コンピュータはもともと計算機でしたよね。
要するに、人間が苦手な分野は人工知能の得意分野であり、人間の得意な分野は人工知能にとっての苦手なのです。そのため、人が得意な分野を扱う人工知能はあまりありません。例えば人間同士のようなスムーズな会話は、人工知能にはできませんよね。Siriがありますが、あくまでも質問に答えるだけです。ところが、そうした分野は人間にとって当たり前であるが故に、その大変さ、重要性が理解されにくいのです。それが難しい点で、どのようにその重要性を押し出していくかが課題です。人間ができないことを人工知能ができるからこそ、そこには最適化のためのコストが発生します。だから人が10時間かかっている作業をロボットが1時間でやってくれれば人件費が安くなってありがたいのです。生産性が上がるため、利益を産むのです。
しかし、人間にとって当たり前のことをロボットがやってもあまり変化がありません。人間が行なう作業のほんの数%でもロボットができたらすごいことですが、その作業は人間よりまだまだレベルが低いものですよね。それだとすごい進歩であっても中々評価されません。しかし、ここはひたすら研究に取り組んでいかなければ人間と共生するロボット、ドラえもんのような存在は決して実現できないのです。しかしそうしたロボットへのニーズが少子高齢化の進む社会の中で出てくるはずなので、私たちは取り組んでいかなければならないと思います。それが野望なのです。
AIの例としては、ハードウェアのロボットもあれば、最近流行の「ポケモンGO」のようなAR技術もあり、様々です。現在は機器を装着する必要がありますが、今後さらに進化していき、普段使うような眼鏡や、もしかしたらコンタクトレンス型の機器で見られるようになると思います。そうすれば、本当は実在しないけれども、メガネをかければそこにいるように感じられるといったことが可能になるでしょう。あるいは、勉強のサポートや、弁論のコーディネーターなどをしてくれるような知的なロボットも開発されるかもしれません。そのように日常生活の支援をはじめ、ありとあらゆることしてくれるAIができるでしょう。つまりは、人間同士では当たり前にできるけれど、AIにはできないことを克服することです。例えば場の空気を読むこと、阿吽の呼吸、気配り。それは当たり前ではないかもしれませんが、しかし人ならできることなのです。そうしたことをAIができるようにしたいと考えて、電通大で研究開発を始めています。
Q:今後力を入れていきたい研究について教えて下さい。
最後に強調しておきたいのは、汎用人工知能は見えにくいのでコンセプトが必要だということです。例えば「アルファー碁」だって、本当の目標はAIで棋士に勝つことではありません。あくまでも自分たちの技術を使って、医療や省エネなど様々な分野に貢献したいのですが、その技術を分かりやすく示すために囲碁で勝つことが非常に有効だったのです。また、世の中には「ロボットがワールドカップで人間に勝つ」というような様々な研究プロジェクトが実施されています。
そこで私たちもそうした方法でAI技術を示そうと考えました。人と会話ができるAIであり、ロボット。さらにはAR技術うことでさらに多様な支援もできる。そうしたコンセプトを示すものがないかと探しました。すると、ここ電通大がある調布は、ゲゲゲの鬼太郎の作者・水木しげるの出身地ですね。そこで、「妖怪」というコンセプトはなかなか良いと気づきました。妖怪は普段、見えたり見えなかったりします。そして人間にはない能力を持っています。座敷童は幸せを呼ぶと言われることもあり、縁起が良いですね。そのように考えると、「妖怪」というコンセプトのもとで私たちのアイディアを形にすると、デモンストレーションとしても分かりやすいのです。
それで、「AI妖怪」というものを作ろうと考えました。妖怪は英語にするとゴーストかフェアリーですが、イメージとぴったり合う言い方がありません。しかし最近流行したアニメ「妖怪ウォッチ」のおかげで、世界中で「Yokai」という言葉が通じるようになったのです。そして“YokAI”というつづりにすえば、「AI」が入っていますしね。こうして私たちは「AI妖怪」をキーワードにし、見せる形で汎用人工知能を作ることになったのです。
栗原 聡
くりはら・さとし
慶應義塾大学大学院理工学研究科卒。NTT基礎研究所、大阪大学大学院情報科学研究科/産業科学研究所を経て、2013年より電気通信大学大学院情報理工学研究科教授。同大学人工知能先端研究センター センター長。博士(工学)。人工知能、複雑ネットワーク科学、ユビキタスコンピューティング等の研究に従事。著書『社会基盤としての情報通信』(共立出版)、『人工知能とは』(近代科学社)、翻訳『群知能とデータマイニング』、『スモールワールド』(東京電機大学出版)等。