新薬の開発は、年々難易度を増している。1つの医薬品を開発するのに、10年以上の開発期間、そして数千億円もの研究開発費が必要だと言われている。また、低分子薬だけでなく、中分子薬や抗体薬などモダリティ(治療手段)も多様化しており、標的タンパク質もさまざまだ。従来は、こうしたタンパク質ターゲットを1つ1つ調べ上げて創薬を進めていた。多様化するモダリティや標的に影響されることなく、より効率的にさまざまな医薬品開発を行うことを目指して、マルチモダリティ志向の情報基盤を研究しているのが、東京工業大学 情報理工学院 情報工学系 大上雅史准教授である。その他にも、大上准教授は「バイオインフォマティクス」領域における、数々の研究を手掛けてきている。今回は、大上准教授が取り組んでいる研究の概要や、今後実現していきたい世界について、お伺いした。
多様な先端技術を化合物や物質のデザインに応用して、成果を生み出す
Q: 研究概要について教えてください。
私が取り組んでいるのは、簡単にいえば「計算で生物学を解明する」もしくは「計算で薬をつくる」研究です。最近ではChatGPTのようなAIが注目されていますが、今風に言えばAI、正確に言えば機械学習を使って予測を行う研究に、15年程前から取り組んでいます。その中で、私はタンパク質間相互作用の予測を行っていました。タンパク質間相互作用というのはタンパク質同士がくっつく現象ですが、実はさまざまな病気のメカニズムに関わっていることが知られています。
例えば、「イレッサ」という肺がん治療薬があります。これは、EGFR(上皮成長因子受容体)というがん細胞の成長に必要な分子に結合して、がんの増殖を抑える薬です。がんの増殖は、EGFRから別のタンパク質にシグナルが伝達し、そこからまた別のタンパク質に情報が伝えられていき、がん細胞が増えて続けていくというがん化経路をたどります。これを「シグナル伝達」と呼んでいますが、この過程もタンパク質間相互作用の1つです。
このように、タンパク質間の情報伝達(相互作用)によって、がん細胞の増殖が起きてしまいます。私は、これまでおもにタンパク質間相互作用の研究に取り組んでいましたが、実際にがん化を抑制する研究をしたいと考え、「情報技術による創薬支援」へとシフトしていくようになりました。最近は、化合物の性質を予測するだけでなく、薬効が期待できる化合物を創り出す「生成AI」の研究も行っています。バイオや創薬のデータについて解析をしたり、既存のデータから未知の生命現象を予測・解明したりする、いわゆる「バイオインフォマティクス」といわれる分野の研究です。
今や創薬が難しい時代になってきています。一説では、1つの新薬開発に、15年もの歳月が必要とされ、開発費用も3000億円超かかると言われています。新型コロナウイルスのワクチンは、非常に早期に実用化されましたが、きわめて稀なケースです。これまでよりも効果のある治療薬、もしくは新しい治療薬を開発しなければならないため、研究開発の難易度は年々上がっていく運命にあります。それだけ難易度が高まっていけば、開発費もそれに応じて高騰し、医療財政が破綻することにもなりかねません。そうならないためにも、できる限りコストを抑えつつ効果の高い薬をつくることが、時代としても求められています。
われわれはAIや機械学習の活用はもちろん、自らアルゴリズムを開発して、プログラムの実装や最適化も行います。当然ながら、大量のデータ解析や膨大なシミュレーション計算も対象になってきます。東工大にある「TSUBAME」というスーパーコンピュータ(以下、スパコン)も活用します。このスパコンの利用は有料ですが、学内の学生や研究者が使いやすいように設計されています。今ではAIの計算にNVIDIAのグラフィックボード(GPU)が当然のように用いられていますが、世界で最初にGPUの計算に目をつけたのは、この「TSUBAME」です。当時は「TSUBAME 1.2」でしたが、2024年4月には「TSUBAME 4.0」にバージョンアップしました。こうしたスパコンを活用して、化学物質の可能性を予測しています。
Q: 独自性はどんなところにありますか?
AIのような先端技術を化合物や物質のデザインに応用して、成果を出しているところでしょうか。先ほども少し触れましたが、AIだけでなく、使える情報技術は何でも活用します。機械学習はもちろん分子シミュレーションも用います。さまざまな情報技術を束ねて、新しい知識を生み出すのが、われわれの研究室の強みでもあります。
Q:最近取り組んでいる研究があれば、教えてください。
新薬の開発に関する研究においては、さまざまな取り組みを行っています。例えば、低分子の化合物では薬の可能性を予測したり、中分子においては、標的とするタンパク質に結合するペプチド配列のデザインを研究したり、環状ペプチドにおける結合の仕方や性質を予測して、創薬の開発に役立てるといった研究にも取り組んでいます。また「タンパク質分解誘導薬」という分子にも興味を持っています。プロテアソームというタンパク質のゴミ処理場に、わざと標的タンパク質を連れて行く働きをする分子をつくって、分解させる、そんな研究も行っています。
最近、特に注力しているのは、効率的な創薬モダリティ(治療手段)の研究開発を行うための、情報技術のプラットフォームづくりです。製薬企業では、低分子医薬や抗体、ペプチド、分解誘導分子など、モダリティごとに担当部署が分かれているケースが多いです。そのため研究プロセスに手数がかかり、開発費も高騰してしまいます。その手間やコストを抑えるためには、比較的広い領域において共通化できる情報技術が必要になってくるため、このプラットフォーム開発に力を入れているわけです。
製薬業界もデータ量・計算力勝負に?共通基盤化を目指して
Q: 今後考えられる課題は何でしょうか?
企業は、さまざまな独自技術やデータを持っていますが、(現段階では難しいことですが)それらの独自情報を束ねると何ができるのかを考えることは、自身の長期的な研究テーマになっています。ターゲットやモダリティが多様化している中で、コストを抑え、より効率的に新薬を開発していくには、(先ほども触れましたが)技術をもっと共通化すべきだと常々考えています。
例えば、ChatGPTは世界に公開され、すでに誰もが使えるようになっています。公開したことでOpenAI社は業界内での立ち位置も変わったでしょうし、今後さまざまな企業がChatGPTを使うようになることで、ある意味で囲い込みもできるようになったわけです。
それと同じようなことがアカデミア(大学)側から生み出せたらどうでしょうか。そうすれば、一製薬企業だけでなく、製薬業界全体の競争力がはるかに高まると思います。ただ、それを実現するためには、膨大なデータが必要になってくるため、それをどう収集していくかが、この情報技術を共通化する上では、大きな課題になってきます。
Q: この分野を志す学生にメッセージはありますか?
情報科学が使われていないところを探す方が大変なくらい、今やどこにでもデータサイエンスやAIが活用されています。私の研究は「創薬×情報」ですが、「●●×情報」の「●●」を考えて新しい分野を自分で切り拓いていくのはとても面白いですし、将来の成功にもつながっていくと思います。ですから、広いアンテナを持って、さまざまなことにチャレンジしてほしいと思います。
成果を出せている学生の特徴に「手数が多い」ということがよく見られます。「とりあえず試してみる」ということに躊躇なく取り組みます。「『こういうのがいい』と思うんですよね」と言う前に、自分でやってみる。その行動力が差になります。巷に情報が溢れていて、「何から手をつけていいかわからない」という環境があるのも事実です。それでも、とりあえず一度でいいからプログラムを動かしてみる。あるいはデータの中身を眺めてみる。この「とりあえず」の回数をどれだけ増やせるかが、研究成果をあげる上では、かなり重要になってきます。
若者の間では、「タイパ」(タイムパフォーマンスの略)という言葉が流行っています。「タイパ」を求めるのも大切ですが、それを判断するためにも、最初は泥臭く手を動かさなければなりません。そういう経験ができるのも学生のうちです。失敗の数が多ければそれだけ成功も生まれます。ぜひ、手を動かす経験をたくさん積んでほしいと思います。
Q: 共同研究はどのような企業と行っていることが多いのでしょうか?
製薬企業や、創薬ベンチャー企業との共同研究が多いですね。創薬ベンチャーだとアリヴェクシス株式会社や、以前はペプチドリーム株式会社とも一緒に研究してきました。最近はさまざまな企業とのコラボレーションも増えてきました。企業がわれわれ大学の研究者に何を求めて、企業がどんな課題を抱えているのかは、話をしてみないと分かりませんので、ぜひ意見交換をさせてもらえるとありがたいですね。
大きな学会に参加すると、さまざまな企業の研究社の方々がいらっしゃるので、そこで情報交換ができることが多いです。やはり、直接会って話さないとわからないこともたくさんあります。企業側のニーズは「特定の標的を狙う分子をつくりたい」といった比較的狭い対象になることが多いのですが、われわれの研究室では比較的広い領域の公開データを使っているため、「◯◯という標的にこの方法を使ったらどんな成果が得られますか」といった質問には答えにくいところがあります。しかし、そこから「企業が保有する独自のデータを使ったらどうなりそうか」を議論することで、オーダーメイドで研究を進めていくという話に発展することもよくあります。だからこそ、企業の人たちとは一度ディスカッションをして、われわれが力になれることを一緒に考えていければと思っています。
Q: 最後に、今後の展望を教えてください。
以前に比べて薬の種類が増えており、それをいかに束ねて予測していくかが大きなチャレンジだと捉えています。AIに聞けば最適な分子を答えてもらえる。そういう世界をつくっていきたいですね。
当然ながら、今のままではデータや学習技術の不足、創薬ターゲットごとのケースバイケースのアプローチといった、さまざまな課題が挙げられます。ですが、あと10年も経てば、これら課題を払拭したサービスも開発できるようになってくるはずです。電卓の中身を知らなくても、電卓は誰もが簡単に利用できています。近い将来AIも、電卓と同じように汎用的に、しかも精度高く使えるようになる時代がやってきます。
そのためにも、今われわれはモダリティを包括的に理解しておくことが重要です。研究室として抗体やペプチドのデザインなどさまざまなことに挑戦しているのは、分子を設計する上で何がネック(課題)になりそうかを把握するためでもあります。ここをしっかりと理解しておけば、情報技術の共通化もスムーズに展開できるようになっていくでしょう。(了)
大上 雅史
おおうえ・まさひと
東京工業大学 情報理工学院 情報工学系 准教授
2014年 東京工業大学 大学院情報理工学研究科 博士後期課程修了、博士(工学)。同年 日本学術振興会 特別研究員(PD)、2015年 東京工業大学 大学院情報理工学研究科 助教、2016年 東京工業大学 情報理工学院 助教、2020年 同 テニュアトラック助教、2024年より現職。