GBFFファイルをIMCにロードする方法を説明します。
GBFFファイルは、多数のGenBank形式ファイルを集めた圧縮ファイルで、2つのファイルから構成されています。
ひとつは、定義ファイルで「*.gbff.gz」というファイル拡張子を持っています(例:bacteria.1002.genomic.gbff.gz)。
もうひとつは、配列ファイルで「*.fna.gz」をいうファイル拡張子を持っています(例:bacteria.1002.1.genomic.fna.gz)。
操作
- 上記の2種類のファイルを任意の場所に保存します。
- メニューから、「Tools -> Multi GenBank File Expander…」をクリックします。
- 「Expand Setting」ダイアログが表示されます。
- Multi GenBank Format File: テキストフィールドに 「Ref…」 をクリックして、保存してある「*.gbff.gz」ファイルを指定します。
- fna File: テキストフィールドに「Ref…」をクリックして、保存してある「*.fna.gz」ファイルを指定します。
- Expand Directory: テキストフィールドに、GBFF ファイルを展開するディレクトリーを指定します。
- 「Run」をクリックします。
- 確認メッセージ「Start Expand?」が表示されます。
- 「はい(Y)」をクリックします。
- 展開の実行が開始され、実行中は進捗メッセージが表示されます。
- 進捗メッセージが閉じたら、展開は終了しています。
- 展開を指定したディレクトリー以下にTaxonomyに従い、階層的に展開されています。
IMCへのロード
- メインディレクトリーツリーのルート上で、マウス右クリックします。
- メニューが表示されます。
- 「Change Root Directory…」をクリックします。
- 確認メッセージ「Change Root Diretory?」が表示されます.
- 「はい(Y)」をクリックします。
- ファイル選択ダイアログが表示されます。
- さきほど展開を指定したディレクトリーを指定します。
- 展開したディレクトリーがルートディレクトリーに変更されます。
- 「+」をクリックして、ツリーを手動で展開します。
- 配列ノードが表示されたところで、ひとつの「*.gbk」ファイルをクリックします。
- 確認メッセージ「Change Current Directory?」が表示されます。
- 配列が属するディレクトリーに非常に多数のファイルが含まれている場合は、ロードに時間がかかります。
- このような場合には、手動でディレクトリを分割しておくことを推奨します。
- 「はい(Y)」をクリックします。
- 配列が含まれているディレクトリーがカレントディレクトリーになり、属するすべてのファイルがロードされます。
- ローティング中は、進捗メッセージが表示されます。
- クリックしたgbkファイルがカレントファイルとなり、フィーチャーマップに表示されます。