MENU

情報・システム研究機構シンポジウム2019

講演2

日本DNAデータバンク・これまでの30年とこれから
    ~国際連携による巨大生命情報基盤へのデータ集約とそれにまつわる諸問題~

中村 保一(情報・システム研究機構 国立遺伝学研究所 教授)

生物のDNAの塩基配列を決めることは、食料生産やエネルギーのクリーン化、産業の基礎作り、気候変動対策、陸の豊かさを守ることなどに関わってきます。「SDGsの17の国際目標の中でも、貧困や飢餓、保健、水・衛生、エネルギー、海洋資源などの目標の達成には、生命の源である遺伝子の研究も大きく貢献できる」と国立遺伝学研究所の中村保一教授は語りました。

世界中のDNAデータを共有する

現代の生物学の研究はDNAの情報なしではできないことがたくさんあります。近年は、DNAを読み出す「シーケンサー」という機械が進歩し、「今や生物学は情報学」と中村教授。まずこの機械でDNAの塩基配列A・T・G・Cをすべて読み出し、「それをコンピューターで解析し、今までに得られた知見と比較するなどして、遺伝子を探り出していく」のが、主要な研究方法の一つとなっているといいます。

このDNAデータを集めている機関が世界には三つあります。米国の「GenBank」(NCBI)、欧州のENA (EBI)、そして、日本の「日本 DNA データバンク」(DDBJ)。この3機関は「国際塩基配列データベース (INSDC) 」として連携し、互いにデータを共有しています。DDBJは約30年前に開設され、中村教授はこのDDBJのデータベース部門長を務めています。収集するのは、主に塩基配列を解釈したデータを含めたデータベースとシーケンサーから出てきた生データ。「現在、 DDBJ / INSDC データベースには、4.5兆の塩基数があり、登録されたファイル数が17億となっています」とのことです(図)。

sympoimg03

DDBJは、日々、全世界で解読された塩基配列情報を査定して受け入れ、データベースに蓄積して公開。インターネットを活用して、検索や解析ができるサービスを広く提供するとともに、スーパーコンピューターも用意して、この大量のDNAデータを活用できる環境も整えています。

イノベーションは思いもよらない使い方から

「今、生物学の世界では情報爆発が起きている」と中村教授。2007年くらいから新しいシーケンサーが登場し、DNAの塩基を決めるコストがとても安くなりました。それまではハードディスクを買い足せば登録情報を納められたが、それができなくなっている状況だといいます。その後、コンピューター技術の方でもブレークスルーがあり、現在は「なんとか落ち着いている」(同教授)状態になっていますが、大変なデータ量を受け付け続ける苦境であることには変わりないといいます。それでも、データバンクの30年後を見据えながら、「生データを残しておくのは思いもよらない使い方をする人がいるからです。誰もが考えなかった組み合わせをして、そこからイノベーションが起きる可能性がある」とその有用性を語っています。

今、ゲノムDNAの読解が完了した生物種の数は16,736種。しかし、16,736種の生物種の理解が完了したということではなく、DNAをいろいろと解析して、生物の理解を進めていく必要があるといいます。「そのためには、大量のデータを蓄えたアーカイブが必要であり、私たちはそれを多くの人に広く提供しています。このデータを使い倒してほしい」と、中村教授はDDBJの積極的な利用を呼びかけました。