MENU

情報・システム研究機構シンポジウム2019

講演6

【第1部】宇宙と地球、生命のシステムを解き明かすデータサイエンス
    「生命科学研究を支える日本DNAデータバンク~ゲノムデータがここまで社会に浸透した理由~」

 有田 正規(情報・システム研究機構 国立遺伝学研究所 教授)

 遺伝子診断から生態系の分析まで、DNA情報解析はさまざまな形で社会に浸透している。あまり知られていないが、世界中の科学者が見いだしたDNA配列情報は、誰でも、無償でダウンロードし(商業)利用できる。お金をかけて取得したデータを全て無償公開する例は生命科学や衛星写真ぐらいだ。

 研究者にもデータを独り占めしたい人は多いはずだが、この無償公開の習慣を根付かせたのは、二重らせんを発見したあのジェームズ・ワトソン。ヒトゲノムは人類共通の財産だとして公開を義務付けた。無償公開の仕組みがどのように成立し、それが今の生命科学研究にいかに貢献してきたのか。最近のパーソナルゲノム研究まで含めて紹介する。 

sympoimg2019-x

■ゲノムデータの預入先の一つは日本にある

 現在、ゲノム・遺伝子ビジネスが盛んだ。その経済効果は8000億ドルになっているという試算もある。「これほどゲノム関連のビジネスが成長しているのはなぜか。それは、遺伝子に関わるゲノムのデータが基本的に無料で公開されているからです」と有田正規教授(国立遺伝学研究所)。 

 生命科学では、他の分野と比較しても例外的に、データを無償公開する文化が根付いている。多くの主要な学術雑誌は、研究者が利用したゲノムデータを公共リポジトリーに寄託しないと、それに関する論文を受理しない。 

 「では、利用したゲノムデータの預入先はどこなのか。世界中で3カ所しかなく、一つは米国のNCBI、二つ目は欧州のEBI、三つ目は日本の静岡県にある国立遺伝学研究所のDDBJです。日々、新しい投稿を受け付けてアップデートし、三つの機関で常にデータを交換しています」 

 大きな騒ぎになった新型コロナウイルスについても、そのアミノ酸の配列は2019年12月の時点で登録されている。DDBJで誰でも検索できる。一般の市民でも可能だ。だからこそ、世界中の研究者がこのDNA配列を解析し、対策などを検討できる。「無償の情報基盤があるからこそ、公平な競争が可能になるのです。しかし、そのデータ量は膨大で、今後は年間で数ペタのペースで増えていきます。無償公開は、黙って達成されるものではないことを知っておいてください」と有田教授。 

■私たちの能力を見る「ゲノム診断」は可能か?

 最近、才能に関わる遺伝子を調べるような「遺伝子診断」の広告をインターネットなどで見かける。「そもそも、『才能』というのは人による評価が関わるもので、科学的に扱えるものではない」と有田教授。ネットなどでよく見かける「遺伝子診断」は、「占い」のレベルだと考えておくのが賢明だと指摘する。 

 自分のゲノムのどこに変異があるのかを本格的に探したい場合は、まず自分のゲノムを全て読み出す必要がある。ネットの「遺伝子診断」では、そこまでしてもらえない。ただ、なんとかして全ゲノムを仮に読んだとしても、どうやって違いを調べればいいのか。少なくとも、比較する対象が必要だ。 

 「私たちは『リファレンスゲノム』と呼ぶのですが、国際的には『IGSR 1000ゲノムプロジェクト』があって、公開に承諾した約3000人分の個人ゲノム情報にアクセス可能な状態になっています。日本人100人分も含まれています。インターネットで『1000 Genomes』と検索すれば、そのデータが公開されているサイトがヒットするはずです。そこからデータをダウンロードすることもできます」 

 ただ、データ量が多くて一人当たり100 GBくらいあるという。100人の日本人をダウンロードするだけでも10 TB。自宅にあるパソコンでは、扱うのは難しい。 

 「そんなときは、ぜひ我々DDBJのスーパーコンピューターを使ってください。私どもは、使う人を分け隔てなくサポートする文化が重要だと考え、さまざまなサービスを無料で提供しています」と有田教授は語る。