シミュレーションと実際のデータを擦り合わせ、シミュレーションの精度を磨く「データ同化」研究。その進歩によって突発的なゲリラ豪雨を先読みできる日が近づいている。にわかに脚光を浴びるデータサイエンスの分野でデータ同化研究を先導しているのは理化学研究所の三好建正先生だ。革新的な気象レーダーとスーパーコンピュータ「京」の両輪が支えるゲリラ豪雨予測の仕組みとは。社会の変化を捉えうるデータ同化研究について、お話を伺った。
Q:現在のご研究内容について教えてください。
私たちのチームはデータ同化の研究に取り組んでいます。ふだん、「データ同化」という言葉を耳にすることは少ないですよね。ではどういうものかというと、コンピュータを使ったシミュレーションと現実のデータを合わせることを意味しています。これが近年は様々な分野で進んでいるのです。例えば天気予報ではコンピュータでシミュレーションして、未来の天気を予測しています。「明日は曇りになる」といったことが分かるのは、コンピュータでシミュレーションを行ない、実際の大気の運動方程式を計算して予測しているからです。他にも、分子の動きを読んでたんぱく質がどのような形をしているかとか、水の中ではどのような動きをするかといった様々なことがシミュレーションできます。
このように便利なものですが、そのシミュレーションの結果が果たして正しいのかどうかはすぐに分からないことがあります。それは計算機の中で数字としてしか出てこないものですから、正しいかどうかを確かめるためには実際に起こっている現象を観察して、その観察結果と同じシミュレーションができているかを調べる必要があります。
つまり、現実世界の実際のデータとの比較を行なうのです。さらに、比較を超えて現実世界のデータをシミュレーションに引き寄せ、同化させます。「フィードバック」という表現がしっくりくるかもしれません。そのように、シミュレーション自体を実際に現実で起こっている物事とくっつけてあげるのが、データ同化の研究なのです。
Q:計算機によるシミュレーションも外れることがあるのですね。
天気予報に反する天気になったときなどは、シミュレーションが外れてしまったときです。通常、シミュレーションにデータを取り込むのですが、それが実は簡単ではないために、こうしてデータ同化の研究が進められているのです。どのような工夫をすれば得られたデータをより良くシミュレーションに生かしていけるかといった課題に取り組んでいます。
当たりはずれといえば、特に「ゲリラ豪雨」は予測が難しい現象です。それは、現在の天気予報では観測しにくい現象だからです。一般に激しい現象はシミュレーションによる予測がばらつき不確実になる傾向があります。当たってほしいものほど当たりにくくなる。激しい現象は小さいスケールで速く起こることが多い上、変動が激しいので、ちょっとの変化が起きただけでも結果が大きく変わってしまうのです。
ですから、すごく強い雨になるか、それほど降らないのか、あるいは、位置がちょっと横にずれるかどうかといったことを正確にシミュレーションするのは難しいのです。
広範囲の情報を3Dで観測できるフェーズドアレイ気象レーダーの登場
Q:それでは、ゲリラ豪雨はどのように予測すればいいのでしょうか。
そのために、我々の研究室ではデータ同化の研究を行なっています。その中でもゲリラ豪雨の予測に関する研究には特に力を入れています。 さて、ゲリラ豪雨は予測ができないから「ゲリラ」なのですが、それをいかに予測すればいいでしょうか。
そのためにまずは、ゲリラ豪雨を細かく観測することが重要です。積乱雲は目で見ていてもすぐに形が変わりますね。早く形が変わるので、その分早く観測しなければいけません。従来の観測技術ではこの素早い変化を捉えられないので、もっと高性能なセンサーが必要だったのです。
そこで現在研究で使用している気象レーダーは、これまでの気象レーダーとは異なる新しいタイプのレーダーです。これを、「フェーズドアレイ気象レーダー」と呼びます。一般的に、レーダーと聞くとパラボラアンテナを思い浮かべますよね。そういったレーダーではビームを線のように出して、その線の上に雨粒がどのくらいあるかを観測しています。つまりパラボラアンテナがぐるぐると回るのは、線を色んな向きに向けて広い範囲を観測しようとしているからです。
それに対して、フェーズドアレイは、パラボラではなく板の形をしています。2メートル四方の板の中に、100本以上のレーダー素子が並んでいます。一度に幅の広いビームを出し、色々なところからはね返ってくる情報を集めることができる仕組みです。同時に大量の情報を集められるので、それを電子処理することで、どこから跳ね返ってきたかを瞬時に見分けることができます。パラボラアンテナのように回さなくても色々なところの情報が一度にとれる新しいレーダーなのです。
日本ではじめてのフェーズドアレイ気象レーダーは、2012年の夏に大阪大学に設置されました。これまでのパラボラアンテナのレーダーを使って積乱雲を観測しようとしても、線を動かしている間にすぐ形が変わってしまいます。そのため、積乱雲のもくもくした形状を目で見ることはできても、中の様子まで知ることはなかなかできませんでした。
ところが、フェーズドアレイ気象レーダーを使うと一気にスキャンできるので、雲の中がよく見えるようになったのです。しかも30秒に一回、全天スキャンができるため、形を立体的に捉えることができます。つまり 3次元スキャナーのようなイメージで観測できるのです。これによってはじめて、ゲリラ豪雨の雲がよく見えるようになりました。
細密なシミュレーションを実現させたスーパーコンピュータ「京」
そうした観測技術の革新に加え、シミュレーションの側では「京」コンピュータを使うことによって、非常にメッシュの細かい情報が得られるようになりました。そもそもシミュレーションをどのように行なうかというと、まず地球の大気をメッシュ状、つまり網の目のように区切ります。そうしてメッシュの中の気温や風などを計算するのです。普通のシミュレーションでは、メッシュは 1キロほどです。積乱雲の幅は数キロ程度なので、このメッシュは少し粗いのですが、「京」コンピュータを使うともっと細かいメッシュに区切ることができます。
ようするに、解像度が格段に上がり細かいところまで見られるようになったのです。デジカメで考えると分かりやすいでしょう。昔のデジカメの画像は荒くてぼんやりしていましたが、センサー技術の向上によって、細かいメッシュで撮影できるようになりました。シミュレーションにおいても同様で、今までゲリラ豪雨を引き起こすような積乱雲、しかも数キロしかないようなものをつぶさに見ることはできませんでした。それが「京」コンピュータの登場によって可能になってきたのです。そして「京」のシミュレーション技術とフェーズドアレイ気象レーダーの観測技術、その二つの登場によってデータ同化の出番がきます。
まず、新しい観測データがとれるようになりました。さらに、細かいシミュレーションもできるようになってきました。こうした進歩によって、実際に目に見えている雲をスキャンし、そのデータを取り込んで、それと同じものを計算機の中に再現することが可能になったのです。つまり、実際の現象と同じものをコンピューターの中でシミュレーションできるので、この先どのように動いていくか予測できるようになります。私たちは、この方法を使えばゲリラ豪雨も予測できるのではないかと考えたのです。
Q:その結果、ゲリラ豪雨を30分前に予測できるようになったのでしょうか。
現状は、そのための手法を開発した段階です。「こうすればゲリラ豪雨を予測できるに違いない」と考えましたが、そこには様々なチャレンジがあります。本当に今までと全く桁違いな技術なのです。というのも、気象庁で現在運用している気象予報のシステムでは、地球全体の予測をするために6時間ごとにデータをとっています。そしてその中で日本の周辺だけを最も細かいもので 2キロメッシュに切って、1時間毎にデータを同化しています。これは世界的に見ても先端をいっています。気象庁のスーパーコンピュータはかなり高性能なので、このくらいのメッシュ、更新間隔が可能なのです。
さらに「京」を使った私たちの研究では、30秒に1回データをとろうと取り組んでいます。つまりこれまで1時間に1回だったものを30秒に1回に、2キロメッシュだったものを100メートルメッシュにしようとしているのです。こういった桁違いの新しいものが、そもそも気象学的にきちんと動くかどうか分かりませんでした。
そのため、100メートルメッシュで30秒ごとにデータを取り込んでもコンピュータが壊れず計算できるのか、そして気象学的に意味のあるシミュレーションがちゃんとできるのかどうかが不明だったのです。私たちが行なったことは、それが本当にできると証明したことでした。
とはいえ30分後のゲリラ豪雨を予測するためには、30秒ごとに正確な計算を行ない、予測結果を出さなければなりません。現状としては、その計算にはまだ時間がかかっています。計算スピードが足りていないといった問題のほかにも、これから解決していかなければならない課題はあるので、まだ道の途上です。ただ、そのための手法を開発したのは大きな成果です。
Q:現在は数分かかるところを数十秒に縮めるのは困難そうですね。
はい、30秒以内に縮めることを目標にしています。30秒ですので、10倍すると5分ですよね。現在5分くらい時間がかかっているならば、すなわち10分の1に縮めなければいけません。もし「京」コンピュータが10台あればできるかもしれませんが、ものごとはそう単純ではありません。現在取り組んでいる問題は、仮に「京」が10台あったとしてもできない計算なのです。
Q:その難題に、どのように取り組んでいくお考えですか?
まずは、計算機を使いこなすことが必要です。さすがにこれだけ大きな計算機ともなると、そう簡単には使いこなせません。そのため、より良く現在の「京」コンピュータを使いこなすために、計算機の専門家であるコンピュータサイエンティストと一緒に仕事をしています。そしてもっと速くできる点を探して、一つ一つ速くしていくといった地道な努力を行なっているのです。
また、メッシュを粗くすることも考えています。そもそも100メートルメッシュでは30秒以内の計算ができない可能性があります。細かすぎて時間がかかってしまうためです。考えてみれば分かるように、100メートルメッシュを200メートルメッシュにすると2倍×2倍なので水平方向に4分の1になります。さらに、そうなると時間方向にも間隔を長くできます。つまり、仮に100メートルメッシュを200メートルメッシュにするだけでも8倍速くなります。その上、データ量も4分の1になるのです。
このように、100メートルメッシュを200メートルメッシュにするだけでこれほど速くできることをふまえると、実際に運用する上ではどのくらいのシステムを作ればよいでしょうか。また、それによって天気予報がどのくらい悪くなるのか、あるいは悪くならないのかといったことも調べなければなりません。現在の予想では、200メートルにしても十分にゲリラ豪雨に対応できる情報が出せるのではないかと考えています。ですから、現在我々はゲリラ豪雨を実際に予想することを考えて、どのようなシステムが必要なのかを調べているところです。
気象レーダー、「京」コンピュータの揃った関西という舞台
Q:あまり日本にはゲリラ豪雨がないように感じますが、どうでしょうか?
いや、実は東京ではよく起こっています。東京は、東と南に海があって、海からの風がちょうど交わる場所にあります。海風がぶつかったところに雲ができやすいので、東京はそういった雲ができやすい土地なのです。日本は海に囲まれていて湿った空気が流れ込みやすいのですね。
Q:神戸も同じようにゲリラ豪雨が起こりやすいのですか。
神戸は南に海があり、海に囲まれてはいないのですが、六甲山があり、状況によってはゲリラ豪雨を引き起こします。2008年にはゲリラ豪雨によって都賀川が急に増水し、子供を含む5名の尊い命が奪われました。
Q:東京の方がゲリラ豪雨の予測を研究するのに向いているのでしょうか。
東京にはフェーズドアレイ気象レーダーがありません。筑波の気象研究所に一台あるのですが、東京から筑波だと数十キロの距離があります。レーダーは、距離が離れれば離れるほど情報が荒くなってしまいます。私たちが取り組んでいるゲリラ豪雨の予測の研究をするには、フェーズドアレイ気象レーダーが必須です。
神戸の付近では、大阪大学にフェーズドアレイ気象レーダーが一台あり、さらに神戸市の西区にも一台あります。また、夏の夕立のようなゲリラ豪雨が起こります。こうしたことから、今は関西を舞台とした研究を進めています。
アメリカで出会ったアカデミックフリーダムと成熟した教育環境
Q:省庁と大学両方の研究環境を経験されていますが、比較するとどのように感じますか。
私がいたのは気象庁の研究所ではありませんでした。本庁の総務部企画課に2年いました。それから予報部数値予報課に異動しました。気象業務を行なうための役所のポジションです。簡単に説明すると、気象業務を行なうためには予測モデルをつくり、データ同化システムをつくり運用を行なう必要があります。そのためのデータ同化システムづくりに関わる仕事でした。その中でも特に、将来に向けたデータ同化システム開発を担当していたので、研究に近いマインドではありました。
ただ、当然ですが気象庁の業務では法律に規定された仕事をします。そのため、いわゆるアカデミックフリーダムはありません。気象庁には気象業務法があり、国全体に資するために仕事をしていました。私は気象庁を辞めた後、メリーランド大学に職を得たのですが、特にアメリカの大学ではアカデミックフリーダムが大切にされています。つまり何より先に自由があるのです。どんな研究を行なうかは研究者自身が決めることでした。その点が根本的に違いました。
Q:アメリカではどのような研究をされましたか。
メリーランド大学では大気海洋科学部でデータ同化の研究を行いました。特に台風に関するデータ同化の研究や、データ同化の理論に関する研究にも取り組んでいました。
Q:日本とアメリカのデータ同化研究を比較するとどうでしょうか。
私が経験した理研に関して言えば、アメリカの大学で研究する場合と大きな違いはありません。むしろ理研の方が環境としては恵まれている点もあります。「京」コンピュータをはじめとした研究資源や環境、とても高価な研究の道具が豊富にあります。「京」コンピュータなどなかなか使わせてもらえるものではありません。
しかし、アメリカと日本のデータ同化研究を比べると、まず日本ではデータ同化を専門に勉強して卒業する学生はほとんどいません。それはデータ同化の専門教育があまり進んでいないためです。一方アメリカでは、気象の研究をしている主要な大学にはデータ同化を専門とする研究室があります。ですからデータ同化を専門として学位論文を書いて卒業する学生が多くいるのです。したがって、人材の層の厚さを比較するとアメリカのほうが優れているでしょう。
さらにその先のキャリアパスについて考えると、アメリカの場合は気象庁に相当するNOAAや、航空宇宙局NASAでもデータ同化の研究を行なっており、政府系機関で研究や技術開発の研究をするといった選択肢が豊富です。しかし日本では、原則として国家公務員試験を受けて合格しなければ、気象庁でそうした仕事をすることはできません。研究をしてから、その先のキャリアパスとして気象庁に入ることは容易ではないのです。
Q:今後日本がスーパーコンピュータの利を生かしてデータ同化の研究を進めていくためには、教育を見直す必要があるのですね。
そうですね、だから教育が一番大事なのではないでしょうか。やはり人材が育たなければトップレベルの研究を進めることは難しいのです。データ同化はデータサイエンスの分野に含まれます。データサイエンス自体は近年流行の兆しが見られますが、物理学や化学、生物学など伝統的なサイエンス分野に比べると、分野としてまだ発展途上です。もちろん、数学などのように大きな柱となる学問ではないかもしれませんが、データ同化は実社会においては非常に重要な役割をもっています。なぜならシミュレーションが現実を忠実に表せるようになればなるほど、より活用できるようになるのですから。
このようにデータサイエンスは重要な学問なので、こういった分野を志す学生は一定数いるはずなのですが、柱として確立されていません。将来に向けての課題なのではないかと思います。
Q:データ同化の研究を志す学生の方々はどうすればいいでしょうか。
学生にはそのような分野があることをまずは知ってもらいたいですね。それにはやはりデータ同化を理解する力が必要だと思いますし、生物や物理などトラディショナルなサイエンスにおける各々の強みや最低限の数学的素養は必要です。そうした基本を身につけた上で、最先端の研究に興味をもってもらいたいですね。最近は最先端の研究者が講演をする機会も多いですから、それらを利用して自分の興味分野を探してほしいと思います。
Q:知見を広げて自分の得意分野をもったまま、新しい研究に飛び込んでいくのがいいのですね。
はい。そしてデータ同化に関していえば、今回は気象を中心にお話しましたが、気象だけではありません。気象以外にも、色んなシミュレーションがあります。例えば私たちは現在、地球の地表を覆う木の一本一本をシミュレーションして、データ同化に取り組んでいます。地球の周りには人工衛星が回っていて、1キロメッシュで地球全体の緑の具合を観測し、どのくらい葉が茂っているかのデータをとることができます。これをデータ同化し、一本一本の木のシミュレーションと合うようにしようと取り組んでいます。
このような研究をしようと思う発想のもととなっているのは、木の生え方に対する興味ですよね。だから必ずしもデータ同化への興味が実際の研究に結びつくとは限りません。自分自身のサイエンスのフィールドが最初にあるからこそ、そこでデータ同化の技術が生かせることもあるのです。まずは色々なことに興味をもつことが重要だと思います。
データ同化の神髄が発揮される社会が到来する
Q:国を挙げて教育面に力を入れていくことが重要なのですね。一方で、企業にはどのようなアクションを期待されますか。
近年、「京」コンピュータの力を「色々な分野で使えるのではないか」と考えられるようになってきています。
これまでの活用例としては、車に使うタイヤの溝の彫り方などに応用され、すでに実装されているものもあります。また、どのような材料をどのように加工すればよいか検討する際にも活躍します。あるいは薬を作る際にも、何度も実験する必要がありますから非常に研究開発コストがかかっていましたが、「京」のシミュレーションを使って一部それを代替することも可能になるでしょう。
つまり、企業にとっても有利にシミュレーションの力を使える時代がこれからくるのではないかと考えています。しかし、そうなったときのためにシミュレーションの結果と実際の現象がきちんと対応している必要があります。ですから実際にとれたデータをシミュレーションと組み合わせていくデータ同化の考え方をもっと幅広い分野に浸透させていきたいですね。そのためにも、企業にはシミュレーションをより一層活用して頂ければありがたいと思います。それによってデータ同化の研究が進み、そのために研究者の需要も増えて、専門的な教育も進んでいくのではないでしょうか。
Q:2016年はポスト「京」開発元年となりましたが、今後データ同化の研究はどのように発展していくでしょうか。
益々データサイエンス的な要素が強くなっていくだろうと考えています。今後ポスト「京」が使えるようになると、現在の「京」よりもさらに桁違いの計算ができるようになるからです。そうすると扱うデータ量が変わります。
そしてデータ同化の分野では計測データが大事です。そのための計測技術、センサー技術も発展してきています。また、センサーデータを情報通信する技術も進んできています。例えば、最近のスマホには温度計や気圧計の機能など様々な機能がついていて、それがすぐに通信できる。このようなIoT(Internet of Things)の時代となり、いわゆるビッグデータと呼ばれるデータの活用も一層進んでいくに違いありません。
計算量は格段に増え、シミュレーションももっと細かくなっていくでしょう。さらに気象に限らず色々なことができるようになっていくと思います。例を挙げれば、現在は脳のシミュレーションの研究も進んでいます。ウェアラブル端末が進歩していますから、センサーを身につければ、人間が目で見て観測するのと同じことがカメラから得られる情報でできるようになるかもしれません。また、さらにデータ同化が進めば、脳のシミュレーションからその人の数秒後の行動を予測することも可能になるかもしれません。こうしたことはまだ夢物語ですが、シミュレーションとデータを組み合わせることで、可能性は広がっていくと思います。
Q:今後力を入れていきたい研究についてお聞かせください。
これまでは「京」コンピュータやフェーズドアレイ気象レーダーといった最先端の技術を組み合わせて、データ同化の最先端研究を行なってきました。今後レーダーがもっと高性能になり、ポスト「京」も完成すれば、研究はさらに先へ進むでしょう。ですから、変わらず最先端の研究を進めていきたいと考えています。
それと同時に、先述の木のシミュレーションのような、違う分野のシミュレーションにも取り組んでいきたいですね。シミュレーションの対象は広がっていき、これまでシミュレーションが難しかったものでも可能になるのではないでしょうか。そのため今後はそういった新しい分野においても、数理科学としてのデータサイエンスを広げていくような活動を行なっていきたいと思います。
Q:それによって社会にはどのような変化があるでしょうか。
近年では気候変動のシミュレーションがよく聞かれますよね。人間社会はその中で存在していますが、人はそうした変化に対して何か行動を起こすはずです。例えば海面水位が上昇したら、低い場所に住んでいる人は住み続けられなくなり移動しますよね。あるいは過剰な森林伐採があれば、法律で禁止するなどの行動に出るかもしれません。そういった行動も、シミュレーションの中に取り込んでいけるのではないかと考えています。
産業革命以降、人間が地球に対して与える影響は、次第に地球規模へと拡大してきました。昔の社会では法律を作って適用しても大した影響はなかったかもしれませんが、人間の力がだんだんと強力になってきたので、現代においては大きなインパクトがあります。例えば「明日からシェールガスを採掘してはいけません」と法で定めたら、きっと地球の未来が変わってしまうかもしれません。
しかし、そのときに社会がどう変わるかは全然分かりません。色々と想像はできますが、もっときちんとサイエンスにするためにはシミュレーションが必要です。つまりトータルな地球環境と人間システムを組み合わせたような、新しいシミュレーションも今後できるようにしていかなければならないと思っています。(了)
三好 建正
みよし・たけまさ
理化学研究所計算科学研究機構データ同化研究チーム チームリーダー。2000年京都大学理学部を卒業し、同年に気象庁入庁。人事院行政官長期在外研究員として2003 年より二年間、米国メリーランド大学に留学し、2005年博士号を取得。気象庁予報部数値予報課技術専門官、メリーランド大学助教授を歴任し、現職。また、メリーランド大学大気海洋科学部客員教授、海洋研究開発機構地球シミュレータセンター招聘上席研究員を兼務し、スーパーコンピュータ「京」を用いてゲリラ豪雨の予測を行なうデータ同化の研究を牽引している。