IoTの普及などにより、「M2M(Machine to Machine)」での通信が当たり前になりつつある今、Machineデバイスの爆発的な拡大が予想され、従来の線形モデルに基づく信号処理方式では限界があると言われている。それに変わる信号処理手法として、凸解析・不動点理論を利用した適応信号処理アルゴリズムで、線形カーネルと非線形カーネルを組み合わせた「マルチカーネル適応フィルタ」を発表したのが慶應義塾大学 理工学部 電気情報工学科の湯川 正裕教授である。2022年7月には米 NVIDIA社と独 Fraunhofer Heinrich Hertz研究所との共同研究によりGPU(Graphics Processing Unit)にも実装され、この技術の有用性が示された。今回、湯川教授に社会実装につながった研究内容と、現在の新たな取り組みについて話を伺った。
非線形適応フィルタを応用した技術が、米企業のGPUに社会実装
Q:研究の概要についてお聞かせください。
私が手がけてきたのは、音響と通信の「適応信号処理」です。機械学習における「確率的最適化」と似通った問題設定を行いますが、「適応信号処理」では、推定する対象が時間とともに変わっていく点が大きく異なります。例えば、音響では、人が動くなどして時間の経過とともに状況が変わります。そういった環境変化に適応させていく点が「適応信号処理」の難しさであり、面白さになります。
研究スタイルとしては、一般的には大きく2つに分かれます。1つは社会的ニーズ(研究課題)が与えられて取り組む方法と、もう1つはまだ世の中に出ていないビジネスの種になりそうな、(技術的)シーズを活かして研究の方向性を模索する方法です。私の研究は、自由な発想で取り組むことが多いので、後者に属します。つまり社会的ニーズありきでなく、時代背景や情報処理の問題設定などを念頭に置きながらも、どちらかといえば自分の興味や好奇心が赴くままにテーマを追究してきました。その中でも、最近は社会的ニーズにつながった研究成果が出てきたので、のちほどその研究について詳しくお話ししたいと思います。
Q:研究における独自性はどんなところにありますか?
一言で言うと、研究のアプローチだと思います。研究では凸解析・不動点理論を利用した適応信号処理アルゴリズムという非常にマニアックな手法を用いています。2001年から2009年までは、線形モデルに基づく適応フィルタの研究を中心に行っていました。その後、新潟大学へ着任した2010年頃は、非線形モデルに興味を持ち始め、「再生核Hilbert空間」を舞台にやってみたいと考えるようになり、2012年には「多カーネル適応フィルタ」、2013年には「数理モデル選択と適応学習を同時に行う適応アルゴリズム」それぞれの論文を世界に先駆けて発表しました。この研究を始めた当初は、まだ適応信号処理を「複数の再生核」を駆使して研究しているのは、世界を見渡しても私たちの研究室しかありませんでした。そのくらい独自性の高いアプローチです。
これまで取り組んできた線形モデルは広く使われている手法ではありますが、実際の事象を捉えるには限界があると考えていました。例えば、スマートフォンに使われているスピーカーは、非線形の歪みが生じます。ある一定の音量になると、それ以上大きくならなくなります。つまり直線的に伸びていかないため、数学的に扱うのが難しいのです。
その他には、太陽光発電において過去の発電量のデータから未来の発電量を高精度に予測する際も、線形モデルのアプローチではうまくいかず、非線形モデルのアプローチが必要になってきます。このように対象を拡張していこうとすると非線形モデルの計算式が求められるため、このアプローチが自然と興味の対象になっていきました。
Q:具体的には、どういう研究を行っているのでしょうか?
それが社会的ニーズにつながった研究で、「無線通信のシンボルディテクション」というものです。私の博士課程時代の同僚で、R.L.G.カヴァルカンテ博士という友人がいます。昔から仲がよく、ポーランドにある自宅に招いてもらったりして、研究のディスカッションなども頻繁に行いました。これが彼との共同研究になります。
無線通信では、どのようなシンボルがユーザー端末から送られてきたかを基地局で検出して通信を行う「シンボル検出」という方法があります。その検出方法に、私が学生時代から研究していた『不動点近似に基づく適応アルゴリズム』を「複数の再生核」によって非線形モデルへと発展させた「多カーネル適応フィルタ」が利用できることに気がつき、共同研究に漕ぎ着きました。そして、2020年に出版された無線通信のための機械学習技術がまとめられた研究書に、この共同研究が掲載されたのです。
従来の通信は「H2H(Human to Human)」で設計されてきましたが、近い将来、「M2M(Machine to Machine)」のデバイス間でのやりとりが当たり前になっていきます。IoTがその典型です。冷蔵庫に「牛乳」がなくなれば、通信を使ってスマートフォンに自動的にそのことを知らせてくれるようになります。このようにIoT化が加速することによってM2Mが増え、将来的には、現在の世界人口の数倍以上ものM2M通信デバイスの拡大が予想されています。そうなると通信量も膨大になり、5Gで活用されているような従来の線形手法のMassive MIMO(送受信アンテナの数を大量に増やして通信の安定化や高速化を図る技術)では、同時に利用できる通信デバイスの数も限られるため、安定した通信が難しいと言われています。そんな中、私たちが研究した非線形の手法なら、その限界を突破することができます。
非線形の手法自体は、これまでにも活用されていましたが、従来のやり方だと、ユーザーが急に基地局に近づいたり、移動して電波の強度が大きく変化したりしたときに、通信が適切につながらない問題が発生していました。私たちが研究した線形カーネルと非線形カーネルを組み合わせた「多カーネル適応フィルタ」を使うことで、受信強度が大きく変化した場合にも劣化しない仕組みがつくれるので、この課題を解消することができます。
なお、この共同研究には続きがあります。研究論文は2018年に国際会議(IEEE ICC)で発表されるとともに、さきほどお話ししたように研究書に掲載されました。論文としてはここまでなのですが、友人のR.L.G.カヴァルカンテ博士が在籍しているドイツのFraunhofer Heinrich Hertz研究所は応用研究に力を入れている研究機関なので、我々が研究した「多カーネル適応フィルタ」を搭載した信号処理装置(実機)を開発してくれました。アンテナで受信された信号が箱内の装置(実機)に入力され、多カーネル適応フィルタで解析した結果がリアルタイムで目の前のディスプレイに表示されます。論文発表から1年もかからないうちにつくり上げられ、その後2022年7月には米NVIDIA社とFraunhofer Heinrich Hertz研究所の共同研究によりGPU(Graphics Processing Unit)に実装され、この技術の有用性が世界に伝えられました。私はこの実装には一切コミットしていません。それでもこのように素晴らしい成果が生まれたことを、私自身、大変誇りに思っています。プログラムとして公開されているので、パブリックにも使えるようになっています。これまで私たちが地道にやってきたことが、ようやく10年かかって社会に実装されるところまで辿り着きました。
Q:最近、新たに取り組んでいる研究などはありますか?
今までは「適応性」や「非線形」の話をしてきましたが、最近はそこに「ロバスト性」という観点を加えた新たな研究に取り組んでいます。「ロバスト性」とは、突発的な雑音や急な環境変化などによって信頼できないデータが含まれてしまいますが、それら不確かなデータによる影響を最小限に抑える仕組みのことです。今や機械学習領域においても「ロバスト性」は重要なキーワードになっています。
私が取り組んでいる「適応信号処理」は、信号を数値化して、データをもとに解を求めていきます。まず数理モデルを立てて(現実世界の物理を数式に落とし込み)、次に最小化するコスト関数を決めて(問題設定を行い)、最後にそれを解き、最適解(現実世界における最適な答え)を導き出すのです。この3つのステップで行いますが、これを何も工夫せずに行うと、突発的な雑音(不確かなデータ)の影響を受けてしまいます。そうならないよう基本的には凸解析を用いながらも、凹みのある関数を一部加えることで、とても大きな突発性の雑音(不確かな)を効果的に除去する枠組みを整えるのが、私たちの数理的なアプローチになります。
最先端のトレンドに追従していくためには、数学のリテラシーが必要不可欠
Q:研究において課題と感じている点はありますか?
理論系の研究だからかもしれませんが、私たちの研究室では企業との共同研究は、それほど多くありません。海外との共同研究では、たまたま運良く社会実装につながりましたが、アメリカなどでは、理論研究が社会実装に繋がる例は珍しくありません。それは、理論系の研究者もプロジェクトに入っていないと研究予算がとれないようになっている背景も理由の一つなのかもしれません。今後は、企業から声がかかるのを待つだけでなく、こちらから働きかけるようなアクションを起こしていくことも必要だと思っています。
Q:この分野を志す学生にメッセージはありますか?
機械学習が注目され、この分野での就職では、機械学習の高いスキルを持ったエンジニアが好待遇で迎え入れられるようになり、学生たちもそういう状況を敏感に察知して、積極的に勉強を行っています。大学1〜2年生でツールの使い方などをマスターするケースもみられますが、多くの学生はそれ止まりになってしまっている点が、個人的には非常にもったいないと感じています。今はAIや機械学習がトレンドですが、それも時代の変化とともに変わっていきます。
そうしたトレンドを追い続けるためには、線形代数や関数解析などの数理的な基盤(数学)を武器として身に付けることが重要になります。この分野は、世界的にも競争が激しく、熾烈な争いです。簡単なアイデアだけで戦っていけるような分野ではありません。今の子どもたちは、小学校の頃からプログラミング学習に触れていて、その子どもたちと10年後に同じ土俵で戦うことを考えてみてください。ツールが使えるだけでは、AIネイティブの彼らとまともに戦うことすらできなくなっているかもしれません。
少し視点を変えますが、AIを使って何かを始めようとしたときに、どうすればよいと思いますか。多くの人は最先端の研究成果を知ろうとするはずです。論文などでそれを解読するためには、ベースとして関数解析や統計などの数学のリテラシーが必要になります。なぜなら、最先端の研究論文はすべて「数学」という言語を使って記述されているからです。これは科学者(研究者)が無理に難しくまとめているわけでなく、長きにわたって、広く人類の役に立つ結果を示そうと思うと、一般化した概念を用いることが有用だからです。
これからは、そのことを理解して、いち早く最先端の研究を自分に取り込んでいける人材が求められてくると思います。ただし、数学のリテラシーを身に付けようと思うと、今の工学系の大学や大学院での学びだけでは、少し足りない部分があります。例えば、ルベーグ積分などの確率論は、機械学習などの最先端研究に取り組む上では当たり前の考え方なのですが、工学系の教育課程ではほとんど学ぶ機会がありません。しかし、この確率論の概念的な考え方をしっかりと学んでおけば、論文に書いてあることを正確に理解することができるようになります。これは大変重要なことです。
そこで、私は2021年に大学3年生向けに、ルベーグ積分を含む情報系学生のための数学全般の講義を新たに立ち上げました。数学を学ぼうという意欲のある学生を受け入れる環境は、他大学でも整いつつあります。今はプログラミングができるだけで、もてはやされる風潮もありますが、その時代がどれだけ続くか。トレンドが移り変わっても、そこに追従できるエンジニアは、考えるベースとなる数学の知識を持っている人であるはずですので、学生時代にその知識やスキルを身に付けてほしいと願っています。
Q:最後に、今後の展望をお聞かせください。
今後の目標はいくつかあります。まずは米国のNVIDIA社で実装された技術を、次は日本でも使われる技術に発展させていきたいと考えています。どのように進めていくかは模索中ではありますが、これまで様々な職場や学会活動等で築いてきた人脈、卒業した学生とのつながりなど、ネットワークを活かせば、可能性はあると思います。
アカデミアでいえば、深層学習の次にくる「ポスト深層学習」を考えなければいけないと思っています。しかし、そこは狙っていくというよりは、これまで通り自分が面白いと思えることを追求していくことでトレンドを見極めていく。そういうスタンスで取り組みたいと思います。(了)
湯川 正裕
(ゆかわ・まさひろ)
慶應義塾大学 理工学部 電気情報工学科 教授
2002年 東京工業大学工学部 電気電子工学科卒業。2006年 東京工業大学大学院 理工学研究科博士課程 集積システム専攻修了。英国ヨーク大学 博士研究員(日本学術振興会特別研究員 PD)、理化学研究所 基礎科学特別研究員、ミュンヘン工科大学 訪問研究員を経て、2010年 新潟大学工学部 准教授に就任。2013年 慶應義塾大学理工学部電子工学科 専任講師、2015年には同大学 准教授を経て、2022年4月より現職。