JBIF
:地球規模生物多様性 情報機構日本ノード

  • システムの概要
    本システムはCOIやITSなどの塩基配列を バーコードオブライフデータベース(BOLD)および公共DNAデータベース(DDBJ)から抽出してデータベースを構築しています。 任意のDNA配列の生物種を同定することが可能なシステムです。
  • 参照するデータベース
     以下のデータベースのいずれかを選択してください。

    ■代表配列のデータベース
    BOLDおよびDDBJには同じ生物種名の塩基配列が含まれています。 生物種を同定するためにはその冗長性が扱いづらいため、1生物種につき 1件の代表塩基配列としたデータベースを構築しています。

    ・BOLD由来のデータベース
    COI-5P (101,458件) データ更新日:2018年1月31日 FASTA (16MB) リストファイル (2.2MB)
    COI-3P (4,574件) データ更新日:2018年1月31日 FASTA (0.7MB) リストファイル (84KB)
    rbcL (37,222件) データ更新日:2018年1月31日 FASTA (7.7MB) リストファイル (0.7MB)
    ITS (24,584件) データ更新日:2018年1月31日 FASTA (3.9MB) リストファイル (0.5MB)
    matK (38,289件) データ更新日:2018年1月31日 FASTA (9.6MB) リストファイル (0.7MB)

    ・DDBJ由来のデータベース
    16S rRNA 細菌 (315,124件) データ更新日:2018年1月31日 FASTA (61MB) リストファイル (4.3MB)

    ■全件のデータベース
    データベースの塩基配列全件に対して比較することが可能です。

    ・BOLD由来のデータベース
    COI-5P (1,814,715件) データ更新日:2018年1月31日 FASTA (263MB) リストファイル (33MB)
    COI-3P (20,210件) データ更新日:2018年1月31日 FASTA (2.8MB) リストファイル (0.3MB)
    rbcL (82,323件) データ更新日:2018年1月31日 FASTA (15MB) リストファイル (1.5MB)
    ITS (118,807件) データ更新日:2018年1月31日 FASTA (17MB) リストファイル (2.0MB)
    matK (85,888件) データ更新日:2018年1月31日 FASTA (18MB) リストファイル (1.6MB)

    ・DDBJ由来のデータベース
    16S rRNA 細菌 (751,232件) データ更新日:2018年1月31日 FASTA (68MB) リストファイル (4.9MB)

  • 同定対象のDNA配列:FASTAフォーマットで入力してください。

    サンプルデータ:
    COI-5P COI-3P rbcL ITS matK 16S rRNA 細菌





  • 代表配列の作成方法
    以下の手順で1生物種につき1件の代表塩基配列としたデータベースを構築しています。
    1. 同じ生物種名の塩基配列を抽出して、生物種ごとにBLAST用のデータベースを作成する。
    2. 各生物種の最も長い塩基配列を抜き出して、その生物種の代表配列候補とする。
        その代表配列候補を用いて、1.で作成したデータベースに対してBLASTを実行する。
    3. 同じ生物種名の全ての塩基配列に対して、 98 % 以上のIdentity かつ 90 % 以上の
        Coverage (クエリ全長に対するアライメント領域の割合) がある代表配列候補を
        代表配列のデータベースに格納する。
    4. 代表配列に格納されなかった代表配列候補の生物種の塩基配列群に対してBLASTClustを
        用いてクラスタリングを行い、最もメンバー数の多いグループの中から最長の塩基配列を
        抜き出し代表配列のデータベースに追加する。

  • 解析方法についてはこちら