「生」と「死」のオミックス:クマムシ乾眠機構の解析

現存する全ての生物は生命活動のために「水」が必須であるが、緩歩動物門を形成する体長0.1-1mm程度の小動物であるクマムシの多くは乾眠という機構によって体内の水分を数%まで低下させて一切の生命活動を示さない無代謝状態に入ることができ、給水によってまた速やかに生命活動を再開できる。つまり、可逆的な生命活動の停止から、生命活動とは何か、を明らかにすることができる可能性がある。この乾眠の分子機構を明らかにするため、我々はゲノム・トランスクリプトーム・プロテオーム・メタボローム解析によって大量データを取得し、計算機によってマルチオミクスデータの解析を行っている。

  クモ糸など超高機能構造タンパク質による素材産業革命

人口増に伴いエネルギー同様問題となるのが、石油や金属などの素材資源の有限性である。一方、生物由来の素材、例えばクモ糸は、金属繊維や炭素繊維を大きく上回る軽量さ・しなやかさ・強靭さを持つ優れた素材であり、生体由来のタンパク質で構成される再生可能な夢の素材である。慶應義塾大学先端生命科学研究所発のベンチャー企業であるSpiber株式会社はこのクモ糸の量産に世界で初めて成功した。一方で、どのような塩基配列を持つ遺伝子が、どのような物性を持つタンパクを作りだせるのか、つまり、機能発現のメカニズムについては現状ほとんど未知である。そこで、我々は内閣府革新的研究開発推進プログラム(ImPACT)において、Spiber株式会社や理研沼田チームリーダーらとの共同で研究を行っている。ここでは、世界中から集めた1,000種のクモを網羅的にde nevoトランスクリプトーム解析することによりクモ糸遺伝子配列を得て、さらに、網羅的に各種物性を測定することにより、得られたビッグデータから、機能発現のデザイン原理を明らかにすべく研究を進めている。

  生命情報科学のためのソフトウェア開発

バイオインフォマティクスは既に生命科学にとって不可欠な分野となりつつあるが、その学問領域としての若さと技術の進歩の早さによって、多くの場合研究は手法やアルゴリズムの開発を伴う。さらに、超並列DNAシーケンサーに代表されるハイスループットな測定手法の発達は大規模かつ多階層なデータの効率的解析を必要とし、研究者の解釈を助けるための可視化を含めたソフトウェア開発が不可欠である。我々は、バイオインフォマティクスのあらゆる場面で必要なソフトウェアを、G-language Projectという枠組みの中で多数開発し、10年以上にわたってフリーソフトウェアとして公開しているG-language Genome Analysis Environment以外にもSplit-tRNA予測で幅広く使われているSPLITSや、ゲノムブラウザのGenomeProjector、パスウェイマッピングシステムPathwayProjector、そして細胞シミュレーションの可視化システムE-Cell 3Dなどがある。

  バイオインフォマティクスソフトウェア

G-Links:生物学のビッグデータの「収集・統合・抽出」を支援する新システム – 分散して存在するさまざまな生物学情報を、より効率よく利用することが可能に(紹介記事へ)

バイオインフォマティクス統合解析プラットフォームEMBOSSとG-languageの融合 – IAB発ゲノム解析サービスと外部ソフトウェア間の連携を強化(紹介記事へ)

バイオインフォマティクスにおけるWebサービスアクセスのためのEMBOSSパッケージ – 既存の解析環境にWebサービスを安定的に連携させる新規ツール「KBWS」の開発(紹介記事へ)

 ゲノム解析統合環境 G-language Systemのウェブサービス – World Wide Webの仕組みを使うことで,ブラウザさえあれば誰でも簡単にゲノム解析が可能に(紹介記事へ)

 Restauro-G:ゲノム再アノテーションソフトウェアの開発 –メタゲノム時代を支援する高速再アノテーションソフトウェアで、比較ゲノム解析前にアノテーションの統一を(紹介記事へ)

 SPLITSによるtRNAの網羅的予測と機能解明 – tRNAを網羅的に予測するソフトウェアSPLITSの開発、そして未知のtRNA発見へ(紹介記事へ)

  オミクスデータ可視化ツール

KEGG Atlasをベースとした多機能ウェブブラウザ「Pathway Projector」の開発 自由に実験データを可視化することができる操作性にすぐれたツールの実現(紹介記事へ)

 Chaos Game Representationによるゲノムのフラクタル解析 複雑系カオス理論を応用した新規ゲノム可視化手法を開発(紹介記事へ)

 Genome Projector: Googleマップで直感的にゲノム情報をブラウジング 最新のインターネットアプリケーション開発技術を駆使して、広大なゲノム情報の世界を探索可能に(紹介記事へ)

 MEGU: 統合パスウェイマップへの複合データ可視化システムの開発 ゲノム、メタボローム、プロテオームなどの大量データ解析の為のパスウェイ可視化webサービスを公開(紹介記事へ)

 Visualizing Complex Omics Information Scientific Visualisation for Genomics and Systems Biology(紹介総説・英文)上記論文の日本語版

  ゲノム情報に基づいたシステム生物学

ゲノム科学とシステム生物学は過去10年程度で急速に発展してきた分野である。ゲノム科学は主に機能アノテーションによってゲノム情報からパスウェイに至るまでの関係性を明らかにし分子生物学に大きく貢献し、システム生物学はそういった要素の集合としてのシステムとして生じるさまざまなダイナミクスを明らかにする視点を切り拓いた。一方で、これら領域の間には未だ深い溝が存在する。そこで、我々は、機能アノテーションをさらに発展させ、マルチオミクスデータや反応速度パラメータを追加し、ゲノム情報からE-Cellなどのソフトウェアで直接シミュレーション可能な細胞内代謝モデルをプロトタイピングするソフトウェアGEM Systemを開発した。このプロトタイプモデルはそのままでは精度の良いシミュレーションはできないが、マルチオミクスデータを解釈する時のコンテキストを提供することが可能であり、複数のハイスループットデータを容易に統合して解析することを可能にする。

  複製するメディアとしてのバクテリアゲノム構造の秩序

特に分裂速度が早い微生物において、ゲノムは単なる遺伝子の集合ではなく、それ自身が絶えず複製され続けるメディアであり、そのためにさまざまな選択圧を受けている。ゲノム中の塩基組成や遺伝子の方向性、オペロンの長さやある種のオリゴ配列の存在確率など、さまざまな要素がこの複製するメディアとしてのゲノムの選択圧に影響を受けている。合成生物学の発展によって《細胞を創る》ことも現代の生命科学の視野に入って来ているものの、このようなゲノム自体に存在する秩序だった構造を無視して遺伝子を寄せ集めただけでは細胞は創れない。そこで、我々はバイオインフォマティクスによりさまざまな微生物ゲノム中に複製プロセスから選択を受けた要素を発見し、その選択圧を数学的に定量化する指標GC Skew Indexを開発した。この指標を用いることでさまざまなゲノム構造に関わる選択圧を比較解析することが可能であり、これまで実験による検証が難しかった微生物の複製終結機構の進化モデルを変異圧のシミュレーションから推定したり、実際にハイスループットシーケンスや合成生物学実験から確認したりすることが可能になった。

  バクテリアゲノム構造

複製プロセスがバクテリアのゲノム構造を決定していることを証明 時間の早送りによってゲノム上で塩基組成の偏りが発生するメカニズムを明らかに(紹介記事へ)

細胞内のゲノム挙動情報を活用したコンティグ再配置アルゴリズムを開発 ドラフトゲノムからゲノム構造の推定が可能に(紹介記事へ)

バクテリアの増殖効率とゲノム対称性の関係性を解明 複製挙動を人工的に対称化させることに成功(紹介記事へ)

 ゲノム変異シミュレーションによるバクテリア複製終結機構の解明 コンピュータシミュレーションが解き明かすバクテリアゲノム進化の軌跡(紹介記事へ)

 環状バクテリアゲノムにおける複製終結点の網羅的予測 DNAの複製終結とdif配列の関係性を解き明かす手がかりに(紹介記事へ)

 一般化GC非対称性指数による複製関連の変異・選択圧の定量化 ゲノムの配列からその複製メカニズムを推定できる画期的新手法(紹介記事へ)

 バクテリアゲノムにおける高精度な複製開始・終結点予測法を開発 テレビやラジオなどのデジタル信号処理で使われるノイズ除去フィルタをゲノム解析に応用(紹介記事へ)

 バクテリアゲノムの複製による選択度合いを定量化 複製するメディアとして最適化されたゲノムのデザインパターンを探る(紹介記事へ)

  その他非モデル生物の解析

  その他

大学院の実習授業「ゲノム工学実習」から5本の国際論文が掲載される 有用微生物5種のコンプリートゲノムを新規に解析(紹介記事へ)

絶滅危惧種「ケンランアリスアブ」の生態にあらたな発見 幼虫をアリ巣中で発見、初の記録に成功(紹介記事へ)

新規紫外線耐性菌株Arthrobacter sp. MN05-02のゲノム配列を決定 特徴的な色素産生遺伝子のパスウェイを明らかに(紹介記事へ)