レポート

9/20 Conference 3rd Day (1)

Conferenceの本編最終日になって、ようやく薄日が差すがすぐに雲って雨が降り出す。蝶の姿も少ないなあ。午前中は以下の2つのSESSION。

  • SESSION 9: BARCODING IN THE WIDER EVOLUTIONARY CONTEXT
  • SESSION 10: STATE-OF-THE-ART PRACTICES: HOW TO MANAGE YOUR BARCODE DATA.

SESSION 9: BARCODING IN THE WIDER EVOLUTIONARY CONTEXT

世界では生物多様性の解明・理解、情報の共有・活用を目的とした様々なプロジェクトが進行している。それらは、相互に連携あるいは補完しあう関係にある。世界的なバーコーディングプロジェクトであるBarcode of Life (BoL) もまさにこのようなプロジェクトの一つである。このセクションの発表は、関連する生物多様性プロジェクトの概要と今後のBoLとの関係についてが主題となっている。

Michael Donoghue (Yale University) Barcoding and the Tree of Life:Tree of Life (ToL)は「系統樹」上に配置する形で世界のあらゆる生物の情報をまとめ、データベース化するとともに一般向けに公開することを目的としたプロジェクトである。本講演では、ToLと世界的バーコーディングプロジェクトであるBarcode of Life(BoL)との関係について、ToLとBoLが情報を共有することで「生命の多様性」(Diversity of Life: DoL)をまとめることができると主張した。一方で、BoLの情報、特にCOIの情報をToLに反映させる際には、祖先多形・母系遺伝などの特性に留意するとともに、交雑個体や雑種についてはBoLのデータベース中でも他と区別すべきだとコメントした。

宮正樹 (千葉中央博) An overview based on >1000 whole mitochondrial genome sequences:発表者らの魚類ゲノムデータベースプロジェクト(MitoFish)によって、これまでに1000種以上の魚類についてミトコンドリア全ゲノム配列が決定されている。これは系統樹の深い分岐を見るのに役立つ。その一方で、短いバーコード配列を網羅的に決定することで、最近の種分化を理解する上で有用な情報源となる。このように、前者は系統樹の「幹」を、後者は「枝」をそれぞれ示すものであり、互いに補完することで魚類の多様化・進化のストーリーを解く新たな研究領域が拓けると主張した。

Dan Faith (The Australian Museum) How large-scale barcoding promotes large-scale biodiversity assessment:現在の生物多様性の喪失の流れを止めることが不可能だが、より迅速に効率よく保護すべき場所を決定できればそのスピードを弱めることは可能であろう。筆者らは、そのための尺度として、種ベースではなく、系統樹ベースに生物多様性の指標を算出する「系統学的多様性(PD: phylogenetic diversity)」を提唱している。本発表では、PDの概要について解説した後、DNAバーコーディングプロジェクトがもたらす膨大な塩基配列情報は、そのままでも自然保護に活用できると結論づけた。

Richard Lane (Natural History Museum London) Barcoding and the practice of systematics:体系学的な研究でDNAバーコードを活用する際のトピックの紹介。その問題点として、バーコードによる「同定」の正確性には限界があること、体系学者はそれに必要な資金を得ることが難しいこと、バーコードによる同定を「表形学」とする批判をあげ、それぞれ解説した。こと同定作業においては、より正確に同定できるのであれば「表形学」的であってもかまわないと思うが、classificationにこれを単純に持ち込むことは大変な問題を巻き起こすと思う。

ここでの質問はToLとPDに集中した。バーコード情報を系統学的研究に活用したい系統・分類学者は少なくないはずだし、特に情報の集まっているグループならなおさらだろう。ToLとBoLが「枝」「葉」として統合すればいいのではという提案もあったが、究極的な目標は同じでも、立ち位置もアプローチも違うので困難であろう。むしろ、これらの情報をシームレスに共有する方法を模索する方が建設的だと思う。

SESSION 10: STATE-OF-THE-ART PRACTICES: HOW TO MANAGE YOUR BARCODE DATA

Sujeevan Ratnasingham (University of Guelph) BOLD, the Barcoding Workbench:DNAバーコーディングは、情報技術を活用して大量の塩基配列や標本情報を扱うことで、同定を支援するが、その核となるのがである。この講演ではBOLDの機能として、塩基配列と標本情報のデータベース、各プロジェクトの進捗状況・標本情報・塩基配列情報の管理を行うシステム(BOLD-MAS)、データベースに保存されているバーコード情報を用いた同定検索システム(BOLD-IDS)が紹介された。今後は、さらにプロジェクトの下流に当たる研究室におけるデータ管理のための機能を行う予定だという。また、韓国ではBOLDのミラーサイトが整備されることになっており、近い将来に英語以外のバージョンも提供されることになるだろう。

Scott Federhen (NCBI/NIH) BARCODE records in GenBank:新しく規定されたバーコード情報のデータ形式の詳細と問題点の指摘。GenBankは、CBOLやBOLDと連携して保存するための新しいエントリーキーワードBARCODEとそのデータ形式を規定し、BarSToolと呼ばれる登録ツールを開発している。BARCODEでは、配列の証拠標本情報が必須であり、各エントリーからは標本コレクションへの外部リンクを張ることにしている。しかし、各コレクションや各組織のIDの不統一、個人コレクションの扱いなどに問題が残っているという。同様の問題が2007年7月の西日本自然史博物館ネットワークの会合でも話題になったのを記憶している。個人的には、コレクションや組織IDのデータベース上での統一化はGBIFのメタデータをTDWGのNatural Collections Descriptions (NCD) で標準化してLSIDを付加すればいいのではと思う。

Simon Tillier (EDIT, Museum National d’Histoire Naturel, Paris) Barcode data, museum catalogs and GBIF:バーコーディングプロジェクトにおける標本データの扱いに関する問題点について。標本データの形式やデータ検索方法はすでに標準化されており、シーケンスデータへリンクする機能など共通点も多いので、今後TDWG, GenBank, Zoobank等で議論することが必要だと主張した。標本情報は各博物館やGBIFを通じて閲覧できるようので、PyWrapperなどのソフトウェアを利用して、BOLDのデータも同様の機能を共有する必要があるだろう。さらに、バーコードの博物館の標本管理ワークへの活用法として、「専門家が不在な標本を予備的に整理するための活用」をあげ、今後はDNA抽出物や組織標本の管理も重要になるとコメントした。

Andrew Polaszek (ICZN, London) Zoobank - the open-access animal name registry - working with CBOL towards the new taxonomy:ZooBankとは動物命名法国際審議会(ICZN)が準備している、公式の動物学名辞書と新種の登録システムのことで、GenBankの塩基配列の配列ライブラリと登録システムに類似したものである。この講演ではZooBankの概要を紹介した後、タイプ標本における要件について、完全な1個体が必須ではないこと、画像や塩基配列などの情報でも代用できることに触れ、バーコーディングのような塩基配列を用いた手法のみによる塩基配列をタイプとした記載が出たときの器具と問題点についてコメントした。

Jim Edwards (Smithsonian Institution) Barcode Data and the Encyclopedia of Life:世界のあらゆる生物の情報を百科事典のように集約したデータベースを構築する大規模プロジェクトEncyclopedia of Life (EOL) の紹介。現在すでにウェブサイトはオープンしており、2008年2月に30000種を含む第1段階のデータベースが公開する予定だという。CBOLとの関係も今後模索していきたいという。

EOLとToLは生物情報の網羅的なデータベースの構築という共通した目的を持っているが、伊藤先生によれば各種に関する情報(種情報)はEOL、系統情報(高次分類群も)はToLという役割分担になるのではという話である。

DNAバーコード情報は、種名・塩基配列・標本データがリンクされたものであり、各データについては種名ならCatalogue of Life/Species2000/ITISなどが、塩基配列はINSDC/NCBI/DDBJが、標本データは各博物館やGBIFがすでに大規模なライブラリを作っている。バーコード情報は、これらの既存の標準的な形式を利用し、互いに連携できる形で公開することになると思う。また、正確な同定はバーコード情報だけではなく、種情報あるいは系統情報と組み合わせる必要がある。今後BoLとToL, EOL, あるいはGBIFなどと連携し、バーコード塩基配列をキーワードとして様々なデータベース情報の検索が可能になることを期待したい。