NCBI Taxonomy | 構造化リストの一覧まとめ

コード	スラッグ	名称	概要	lineage	rank	taxonomyId
2157	archaea	古細菌	細菌とは異なる原核生物のドメインで、極限環境に適応した単細胞生物群です。	cellular organisms	domain	2157
2	bacteria	細菌	最も多様で普遍的に分布する原核生物のドメインです。	cellular organisms	domain	2
2759	eukaryota	真核生物	膜で囲まれた核を持つ細胞からなる生物のドメインです。	cellular organisms	domain	2759
10239	viruses	ウイルス	宿主細胞に依存して複製する非細胞性の感染性因子です。	root	superkingdom	10239
28384	other-sequences	その他の配列	人工配列やプラスミド、トランスポゾンなど生物以外の配列データを含む分類です。	other entries	no rank	28384
12908	unclassified-sequences	未分類配列	特定の分類群に帰属できない配列や環境サンプル由来の配列を含む分類です。	unclassified entries	no rank	12908

NCBI Taxonomy（National Center for Biotechnology Information Taxonomy）は、米国国立生物工学情報センターが維持管理する、生物の分類と命名法に関する包括的なデータベースです。このデータベースは、GenBankをはじめとする公開配列データベースに登録されたすべての生物を体系的に分類しており、現在地球上で記述されている生物種の約10%をカバーしています。生物医学研究やバイオインフォマティクス解析において、遺伝子配列データと生物学的分類を結びつける重要な役割を果たしています。

NCBI Taxonomyの最上位階層は、生命の三ドメイン説に基づく古細菌（Archaea）、細菌（Bacteria）、真核生物（Eukaryota）の3つの主要ドメインと、非細胞性のウイルス（Viruses）、そしてデータベース管理上必要なその他の配列（Other sequences）と未分類配列（Unclassified sequences）から構成されています。この階層構造は、分子系統学的な知見に基づいて継続的に更新され、最新の科学的理解を反映した分類体系を提供しています。

研究者にとってNCBI Taxonomyは、いくつかの重要な用途を持っています。まず、遺伝子配列の生物学的コンテキストを理解するための基盤として機能します。特定の配列がどの生物群に属するかを知ることで、その機能や進化的背景についての洞察が得られます。また、比較ゲノム解析を行う際に、適切な比較対象を選定するための重要な情報源となります。さらに、メタゲノム解析において、環境サンプルから得られた配列データを分類する際の参照データベースとしても広く利用されています。

NCBI Taxonomyの特筆すべき点は、その包括性と継続的な更新にあります。新種の発見や分類学的な再編成が行われるたびに、データベースは更新され、科学コミュニティに最新の分類情報を提供します。また、各分類群にはユニークな分類ID（Taxonomy ID）が付与されており、データベース間での情報の相互参照が容易になっています。このシステムにより、研究者は世界中の配列データを効率的に検索・分析することが可能です。

実際の研究活動においては、NCBI Taxonomy Browserを通じてデータベースにアクセスし、特定の生物群の系統関係を視覚的に探索することができます。また、FTPサイトからは分類データの一括ダウンロードが可能であり、大規模なバイオインフォマティクス解析パイプラインに組み込むことができます。このように、NCBI Taxonomyは単なる分類表としてではなく、現代の生命科学研究を支える動的なインフラストラクチャーとして機能しています。