遺伝子自体の塩基配列を含んで、それらの上流400bpまでの塩基配列を出力することは簡単にできます。
- メニューからOption Setting --> Feature Setting --> Search Option を開きます。
- Number of upstream basesに400を入力し、Applyをクリックします。
- メニューからSearch --> Feature Key Searchを選択します。
- Feature Key Searchダイアログから、CDS(あるいはgene)にチェックし、Setをクリックします。
- Feature Key Search Result Windowで、左側パネルのFeature KeyのCDSにチェックします。
- 右側パネルに全CDSのリストが表示されます。
- Select Allをクリックします。
- FastAをクリックします。
- FastAフォーマット(Single FastAの複数ファイルあるいはMultiple FastAを1ファイル)を選択します。
- Saveでその遺伝子とその上流400bpの塩基配列がFastAファイル出力されます。
遺伝子の上流だけの配列を入手されたい場合は、上記の操作でいったん全CDSをCSVファイル出力します。
その後で、Excel等で開始位置を終了位置、新たな開始位置を上流400bpとして編集します。
編集後のファイルをインポートし、たとえば、5'UTRなどというFeature Keyとしてインポートします。
1~10と同様の方法で、今度は5'UTRを対象として同じ操作をします。ただし、今度は、Number of upstream bases にゼロをセットしておきます。
遺伝子の上流だけを出力する操作は上記の様に少し面倒であるため、今後、「遺伝子配列を含まず、その上流・下流の塩基配列を出力する機能」を開発予定に入れておきます。