JBIF
:地球規模生物多様性 情報機構日本ノード

  • 解析方法について
    生物種同定システムの解析は以下の手順で行われます。

    1. 送信されたDNA配列をFASTA形式で保存し、指定したデータベース(COIやrbcLなど)に対して
        BLAST(version: 2.2.24)を実行する。実行コマンドは以下の通り。
        # blastall -p blastn -d [データベースファイル] -i [クエリファイル] -o [出力ファイル]
          -b 20 -v 20 -m 8 -F F -a 4
    2. 1.にて得られる出力ファイル(BLAST形式)から、同定率の高いIDを上位10種取得する。
        さらにそのIDに対応する生物種名を取得し、各生物種における系統情報を検索する。
        系統情報は、NCBIのTaxonomyデータベースから取得している。
    3. 1.にて得られる出力ファイルから20件のIDを取得し、それぞれのFASTAを取得、結合する。
        さらにクエリのFASTAを結合し、21件のマルチFASTAファイルを作成する。
    4. 3.にて出力したFASTAファイルに対してClustalW(version: 2.1)を実行し、
        アライメントファイルを出力する。実行コマンドは以下の通り。
        # clustalw2 -infile=[FASTAファイル]
    5. アライメントファイルに対して、treeオプションを用いてClustalWを再度実行し、
        Phylip形式の系統樹ファイルを出力する。実行コマンドは以下の通り。
        # clustalw2 -tree -infile=[アライメントファイル]
    6. R(version: 3.1.1)のapeライブラリ(version: 3.1-4)を利用し、系統樹ファイルから
        系統樹画像を出力する。実行スクリプトは以下の通り。
        library(ape)
        png(file="', "[系統樹画像]", width=800, height=600)
        tr <- read.tree("', "[系統樹ファイル]")
        label <- tr$tip.label
        index <- which (label=="Query", arr.ind=TRUE)
        front <- index - 1
        back <- 21 - index
        plot (tr, tip.col = c(rep("blue", front),"red", rep("blue", back)), use.edge.length=F, edge.width=2)
        title("New Barcode System", cex=1.5)
        axisPhylo(side=1)