2021年3月4日木曜日

データサイエンスに期待するもの

1953年、DNA二重らせん構造が発見された。この世紀の発見は、生物が有する喜怒哀楽といったいかにもアナログな感情の表象の裏に、デジタルデータの暗号が隠されていたことを意味するものでもあった。この瞬間こそが、生命科学におけるデータサイエンスの扉がカチャリと開いたその時と言えるのかもしれない。

デジタルデータの始まりはほんの些細な事柄だった。1980年初頭から10年間、京都大学の沼研究室は世界の分子神経生物学を圧倒的にリードしていた。当時のDNAシークエンスといえば、アイソトープの写真フィルムに写り込んだATGCの陽性バンドを人間の目でひとつひとつ解読する、という極めて原始的なものだったため、一度に読める量はせいぜい100〜300ベースくらいであった。これをかの沼研究室の教授室で確認作業を行っていたというのだからとんでもない話である。つまり、当時はまだまだデジタルデータが人間の感覚器の精度に委ねられていたのだ。

さらに30年経過した今現在の実験装置は、なんと1度の稼働で数十億から数百億ベースのDNA配列を解読する。さらにそこへ顕微鏡の技術が飛躍的に発展しデジタルカメラの高性能化が相まって、多次元かつ多量のイメージデータが研究者にサプライされることになった。その上論文も全てがデジタル化され、研究者個人が手にすることができる情報そのものが凄まじい勢いで増え続けているのである。加えてarXivに代表されるプレプリント式発表形態やSNS上での自由な討論の場など、研究者にとって彼らの最新情報を発信する手段はもはや論文や学会会場だけに留まらず、本人のアイディア次第でネットの海の中でどのようにでも自由に表現することができるのだ。これは何も生命科学領域に限ったことではない。社会のあらゆる分野で人間の処理能力を遥かに超えたデジタルデータが飛び交っている。

しかし人間が生きている中で自分の神経を最大限に尖らせても得られる情報はさほど多くない。生身の人間の情報処理能力にはやはり限界があるのだ。だが、玉石混交とはいえ、砂漠の砂粒ほどに溢れる膨大なデジタルデータの中には、何か重要な意味を持つものが隠れているかもしれない。この砂漠の中から自分の家の鍵を探すような試みを、私はデータサイエンスが実現することになると期待している。

世界には今まさにAI第三次ブームだ。ルールを教えることなく囲碁やビデオゲームで最高のパフォーマンスをするMuZero、不可能と思われていたタンパク質の立体構造を類推するAlpha Fold2、驚異的な精度を有する言語モデルGPT-3、言語からクリエイティブなイラストを描き出すDALL-Eなど、ここ数か月間だけでも素晴らしい成果が次々と世に発表されている。これらを可能にした技術開発の裏には、未知の境地へ至ろうとするハイレベルなAIエンジニア達が存在しているのは言うまでもない。彼らがいつか、人間の元を大きく飛び出し一人歩きし出したデジタルデータを再び人間がコントロールできるものとして引き戻し、やがて人間の閃きによって革新的な新発見をもたらすだろう。

今一度科学者は自分の五感を疑う時期に来ている。ロバート・フックは、顕微鏡を自作することで自分の感覚器(目)の機能拡張を図り、結果として「細胞」を発見するに至った。我々は今こそAIとデータサイエンスを駆使することで限界のある自分の感覚や思考の拡張を促し、新たな視点をもって研究に向き合うのだ。

自然科学研究機構を構築する天文学、核融合科学、分子科学、生理学、生物学。そして今後は他の大学共同利用機関法人をはじめ、より幅広い研究分野との間でさらなる連携を求められるようになるだろう。その時このデータサイエンスが、学問領域間に横たわる高い垣根を超えて互いを繋ぎ合わせ、さらなる新分野への発展を促すための起爆剤となることを、私は心の底から期待している。

ちひろ
え~、そっちいく??(ジブリ提供)


*機構内広報誌NINS Bulletinへの寄稿文を転載

0 件のコメント:

コメントを投稿