ゲノム解析ソフトウェア技術情報サイト

インシリコバイオロジー株式会社 公式技術情報サイト

機能メニュー

IMC T07A Multiple GenBank ファイルをタクソノミー展開する

多数のGanBank形式ファイルから構成されているGBFFファイルを個々のGenBankファイルのTaxonomy記述に従い系統樹状のディレクトリ―に展開し、IMCで取り扱いしやすく配置します。

背景

GenBankやRefSeqの塩基配列データは、リリース時期ごとに大きな圧縮ファイルにまとめられています。

また、個々のエントリーは、ヘッダーファイル(*.gbff)と配列部(*fna)から構成されおり、シングルGenBankファイルとするには、これらの2種類のファイルを結合する必要があります。

GenBank File Expanderは、GenBankやRefSeqのこれらのファイルを解凍し、合成し、任意の場所に系統樹状のディレクトリとして展開します。

この展開されたディレクトリをIMCのルートディレクトリに指定すると、IMCのディレクトリツリーに表示、ロードするとことができます。

操作

メニューから「Tools -> Multiple GenBank File Expander」をクリックします。

 

「Expand Setting」ダイアログが表示されます。

Multiple GenBank Format File: テキストフィールドにGBFFファイル(フルパス)を指定します。

fna File:テキストフィールドに対応するfnaファイル(フルパス)を指定します。

Expand Directory: に展開先のディレクトリー名(フルパス)を指定します。

Runをクリックします。

確認メッセージ「Start Expand?」が表示されます。

「はい(Y)」をクリックします。

展開が実行され、実行中は進捗メッセージが表示されます。

実行が終了すると、指定したディレクトリー以下に各シングルエントリーが格納されます。

 

 

SureServer for SAKURA(EV)