インシリコバイオロジー 社のソフトウェアを使用して実現できる先進的かつユニークなソリューションを多数掲載しています。「機能と操作」では、与えられた課題に対して、インシリコバイオロジー社の製品がどのような解決方法を提供できるかを説明しています。
これらの機能を実装しているソフトウェア
GT は IMC のほとんどすべての機能を バンドル しています。
IMC には用途に応じて、以下の エディション が提供されています。
おおよその機能の包含関係は以下の通りです。
IMCEE < IMCSE < IMCGE < IMCAE < GT < IMCPE
MetaGenomeGambler:メタゲノムアセンブリ・アノテーションソフトウェア ⇒ 後継製品 GenomeTraveler
isAssemble: ゲノムアセンブリソフトウェア ⇒ IMC に バンドル
iSpider: ゲノム配列・アミノ酸配列データ自動収集ソフトウェア ⇒ IMC に バンドル
TaxiSpider: 系統樹操作でゲノム配列・アミノ酸配列取得ソフトウェア ⇒ IMC に バンドル
|
|
ソフトウェアを起動するためには以下の方法があります。
IMCを終了するには以下の方法があります。
IMCでは以下の操作がよく使われます。
初めてIMCを使う場合にご覧ください。
GenomeTraveler(GT)を初めて利用する場合は以下をお読みください。
GTの最初の起動時には、サンプルデータが自動的にインストールされます。
このサンプルデータを使用して、操作の練習ができます。
サンプルデータが表示されない場合は、demo ディレクトリがを確認して、そのディレクトリをルートディレクトリに変更すると、表示されます。
サンプルデータには以下ものがあります。
アセンブリ、マッピングに使用されるBAMファイルをインポートした結果が格納されています。BAMファイルの各フラグメントをAlignment Viewerで閲覧することができます。
レファレンスゲノムデータと、そのゲノム上にLASTを使用してNGSリードをマッピングした結果が格納されています。レファレンスゲノムデータをIMCを起動して閲覧・解析することや、マッピングの様子をAlignment Viewerを起動して、閲覧・解析することができます。同じNGSデータを用いて、新たにマッピングを実行することも可能です。
OASESを使用したNGSリードのアセンブリ結果のAFGファイルが格納されています。これをBAMファイルに変換して、Alignment Viewerを起動します。また、同じリード使用して新たにアセンブリを実行することも可能です。
レファレンスゲノムデータと、そのゲノム上にSLIDESORTを使用してマッピングした結果が格納されています。レファレンスゲノムデータをIMCを起動して閲覧・解析することや、マッピング結果はBAMファイルに変換して、Alignment Viewerで閲覧・解析することができます。同じNGSデータを用いて、新たにマッピングを実行することも可能です。
Velvetアセンブラを使用してNGSリードのアセンブリ結果のAFGファイルが格納されています。れをBAMファイルに変換して、Alignment Viewerを起動します。また、同じリード使用して新たにアセンブリを実行することも可能です。
![]() |
|
![]() |
IMCのワークベンチは以下の要素から構成されます。
*印の要素は、ワークベンチウィンドウからのドックアウト(取り外し)、ドックイン(組み入れ)が可能です。 |
![]() |
|
メニューバーは、IMCの各機能を起動します。
多くの機能は、メニューバーのメニューとツールボックスのアイコンの両方をもち、いずれも同等の動作をします。
メニューバー以外にもメニューをもつものがあります。
レーン上やフィーチャーレーンのフィーチャー上などから独自のメニューを表示し、予め選択された範囲に対する限定されて機能を実行することができます。
メインツールボックスは、IMCの各機能を起動します。
多くの機能は、メニューバーのメニューとツールボックスのアイコンの両方をもち、いずれも同等の動作をします。
メインツールボックスは、通常、メインウィンドウの上部にドックインされていますが、必要に応じてウィンドウ外へドックアウトすることや、表示を最小にすることができます。
個々のメインツールアイコンは独立に非表示にすることができます。
メインウィンドウ以外の各種ウィンドウやダイアログにもそれぞれのツールボックスをもつものがあります。
しかし、これらの表示・非表示は変更できません。
GT では、NGSからのReadに関して、一次解析としてアセンブリやマッピング、二次解析として遺伝子発現解析などを実行できます。
これらの解析結果は原則として、現在設定されているルートディレクトリの下に格納されます。
ルート(root)ディレクトリーは、論理的なデータ格納場所を物理的な格納場所と結びつけるもので、現在使用しているカレントルートディレクトリ―は、かならず物理的なディスクスペースを指示しています。
ルートディレクトリ―は、別の物理的な位置を示すように変更することができます。
この操作を行うと、ルートディレクトリ―は別のディスクスペースを示します。
ルートディレクトリ―切替操作は何度でも繰り返すことができますが、解析実行中は切り替えることはできません。
ルートディレクトリ―以下には、複数のプロジェクトを登録できます。
1つのプロジェクトには、1つのゲノムを対応させます。
Assembly Project
あるゲノムの de novo アセンブリを実行する場合は、1つのプロジェクトを新規に登録し、そのプロジェクトの下に1つのAnalysisノードを登録し、そこでアセンブリを実行します。
1つのAnalysis ノードで1回のアセンブリを実行します。
パラメータを変えて、複数のアセンブリを実行する場合は、それぞれ1つずつAnalysis ノードを登録します。
異なるゲノムのアセンブリを実行する場合は、新規に別プロジェクトを登録するのがよいでしょう。
Mapping Project
あるゲノムに対して、複数のRNA-Seq結果をマッピングする場合は、1つのプロジェクトを新規に登録し、そのプロジェクトの下で、複数のマッピングを実行します。
マッピングに際しては、Readの貼付け先である、参照ゲノム配列を登録する必要があるため、プロジェクトの下のReference ノードに参照ゲノム配列をロードしておきます。
アノテーションが付いているGenBankやEMBL形式ゲノム配列も注釈付きでロードし、マッピング結果と注釈を並行に閲覧できます。
RNA-Seqなどのデータは、そのプロジェクトにまとめてロードしておき、マッピング時点で使用するデータを選択することができます。
1回のマッピング操作は1つのAnalysisノードを登録し、そのノード上で実行します。
フィーチャーは、ゲノム配列上の生物学的特徴や化学的、構造的特徴です。
フィーチャーキーは、フィーチャーを分類するタイプを示します。フィーチャーキーやフィーチャーは、国際塩基配列データベースへの登録の際に厳格に定義されているものが多く、自由に変更できないものがほとんどです。
インシリコバイオロジー社のソフトウェアでは、フィーチャーキーやフィーチャーを拡張し、処理や表示の制御に使用しています。
既定フィーチャーキー
フィーチャーキーの登録、編集、削除
テンプレート機能
フィーチャーキー検索
Feature Keyの種類
属性
IMCが独自に設定しているフィーチャーキーがあります。
独自フィーチャーキーは、フィーチャーの描画や編集を制御するために存在しています。
独自フィーチャーキーを一括取り除く機能もあります。
Qualifierの種類と役割について説明します。
GenBank / EMBL / DDBJの国際塩基配列データベースの規約において、Qualifierの使用規則が定められていますが、IMCでは独自のQualifierをも追加して、有用な機能を実現しています。IMCが独自のQualfierを設定している理由は、GenBank / EMBL ファイルに直接制御データを記述し、利用者が配列ファイルの取り扱いが簡単になるためです。
上記規約で取り決められたQualifier
IMCが独自に追加したQualifier
/genomemap=
/new=
/update=
Featureの属性を示すQualifierの表示方法や編集方法に関する情報を提供しています。
以下はFeatureに記述されているQualfierの値の表示方法を2つを表しています。
ゲノム配列上におけるフィーチャーの位置にかんする説明。
制限酵素やPCR増幅によるフィーチャーの断片化について説明します。
PCRやライゲーションによるフィーチャーの合成を説明します。
フィーチャーフュージョン機能は、2つの同一positionにある同一Feature Keyに属するフィーチャーを1つに融合する機能です。融合されるそれぞれのフィーチャーに記録されていたQualifierは融合されたフィーチャーのQualifierとしてどちら側のQualifierも同等に保持されます。
この機能により、同一のフィーチャーに対して別々に付けられた複数のアノテーションを簡単に1つにまとめることができます。
フィーチャー演算子は、同一Feature Keyに属する2つの互いにオーバーラップするフィーチャーの論理演算を行い、新たなフィーチャーを生成する機能です。
上図の上下矢印がオーバーラップするフィーチャーで、中央の分割された矢印が演算生成されたフィーチャーです。
個々のフィーチャーにリンクし、その可視化ツールを起動できるのは以下のものがあります。
個々のフィーチャーへのマッピング
フィーチャーやフィーチャー範囲の塩基配列やアミノ酸配列を選択してファイルとしてエキスポートすることができます。
Feature Export機能には、以下があります。
この他に、検索機能の結果をファイル出力する機能を使用すると、実質上、フィーチャーのエキスポートとなります。
フィーチャーの任意のQualifierに連番を付加します。
連番とするQualifierを選択することができます。
通常ユーザが独自のQualifierを登録することはできませんが、連番を付加する場合にのみ使用する独自新規Qualifierを作成することができます。
連番は、接頭詞+連続番号から構成され、連続番号はさらに開始番号と増分で生成されます。
連番の対象となるフィーチャーは、ゲノムの塩基位置の上流側に近いものから順に付加されます。
1種類のフィーチャーキーに属するフィーチャーだけでなく、複数のフィーチャーキーに属するフィーチャーを混在して連番付加できます。
検索結果などの絞り込んだ対象について連番を付加することもできます。
以下の検索機能で連番付加できます。
IMC の フィーチャーマップ は多様なカスタマイズ機能(フィーチャーレイアウトスタイル対応)を有しており、望み通りの遺伝子地図などを描画、印刷することができます。
遺伝子地図 (フィーチャーマップ)作成、地図のカスタマイズ(フィーチャー配置方法、形状、カラー、ラベル)
独自フィーチャーキーの登録
環状DNA 対応のスクロール、地図描画
高速ズーム、スクロール、ナビゲーションレーン
GenBank/EMBL フォーマットファイルとの連動
コンテントマップ(組成ファイル)のグラフ描画・印刷
フィーチャーレイアウトスタイルを使用することにより、複数の機能別レーンを組み合わせてフィーチャーマップを描画する際に予め登録したレイアウトを適用することにより、簡単に複雑なフィーチャーレイアウトをもつフィーチャーマップを描画することができます。
配列レーンには、現在ロードされている塩基配列ファイルの塩基および、もしそこがコーディング領域である場合はアミノ酸配列がそれぞれストランド別に表示されます。
配列レーンはフィーチャーマップのどの位置にも配置することができます。必要であれば2個以上の配列レーンを1つのフィーチャーマップ上に配置できます。
塩基4種類とアミノ酸20種類はそれぞれ個別に異なるカラーで表示することができます。
描画カラーおよびフォントサイズの変更は、フィーチャーセッティングのSequence Lane タブペインで行います。
アミノ酸1文字コードをコドンのどの位置に置くかを変更することができます。
スタートコドン候補やストップコドンの位置を示す矩形をフレーム表示領域に表示できます。
フォントタイプの変更はできません。
コンテント・プロファイルレーンは、塩基組成などの数値をスライディングウィンドウ手法を用いて、それらのプロファイルを表示するためのレーンです。
コンテント・プロファイルレーンに表示できる登録済プロファイルは以下の通りです。
Navigation Laneは、Feature Map全体の鳥瞰地図を表示し、スライダでFeature Mapの表示位置を移動することができます。
局所ゲノム再配置マップレーン(LGRMレーン)は、局所ゲノム再配置マップをメインフィーチャーマップ上に 描画するためのレーンです。
2株の近縁株の間の塩基単位での変異を表示します。
このレーンには、変異リストダイアログが連動しています。
実装エディション
IMCGE, IMCAE
, IMCDS
, GT
発現プロファイルレーンは、タイリングアレイやRNA-Seqによる発現データをグラフ表示するためのレーンです。
実装エディション
IMCAE, IMCDS
, GT
メインフィーチャーマップには複数の発現プロファイルレーンを登録・表示でき、1つのフィーチャーマップ上に登録・表示できるレーン数には制限がありません。
表示レーン数が多くなると縦スクロールする必要があります。
レーンはゲノム位置に依存する発現量を棒グラフあるいは折れ線グラフで表示できます。
レーン毎に表示や計算の設定を変えることができます。
縦スクロールバーレーン
配列スケールレーンとマップスケールレーン
IMCで使用する配列データ・ファイル、フィーチャーデータ・ファイル、オプションデータ・ファイルなどについての操作説明です。
ゲノム配列やアミノ酸配列ファイルをIMCにロードします。
ゲノム配列やアミノ酸配列ファイルを保存します。
外部からデータをインポートし、配列上にマッピングします。
配列からデータを抽出し、外部にエキスポートします。
1つの形式から別の形式へデータを変換します。
制限酵素データ・ファイル、プライマーデータ・ファイル、モティーフデータファイル、SNPデータファイル、アレイデータファイル、など一般に使用されるアプリケーションデータファイルの操作について説明します。
|
各種検索機能に共通な操作をここで説明します。
参照ゲノムマップ に ゲノム塩基配列 をロードするだけで Blast検索用データベース が自動的に作成され、そのデータベースに対する 相同性(Blast)検索 を簡単に実行できます。
相同性検索 には クエリー配列 と 配列データベース および 検索プログラム の指定が必要です。
検索プログラムは以下から選択できます。
指定されたゲノム領域に存在するフィーチャー全部をクエリー配列として一括してホモロジー検索を行います。
現在メインフィーチャーマップに表示されているゲノム配列上を入力した配列で相動性検索します。
IMC E01 制限酵素処理を参照ください。
変異探索機能を参照ください。
![]() |
IMCには以下のように種々の表示用ウィンドウがあります。
|
ゲノムアノテーション 用に用意された ビューア・エディター です。
メインウィンドウ から独立したウィンドウです。
ビューア機能
多重リニアゲノムマップビューアは、複数の近縁種ゲノムの遺伝子などのFeatureをゲノム毎に並列に比較描画するビューアで、IMCメインウィンドウにドックインされています。
別名を、リニアゲノムマップビューア、参照ゲノムマップ、参照マップなどと呼んでいます。
ビューアの機能
IMCメインウィンドウからドックアウトし、独立したウィンドウとして、移動やリサイズが可能です。
メインフィーチャーマップと連動させることができます。
多重リニアゲノムマップ上の各CDSフィーチャーからロードされている他の近縁種ゲノムのCDSに対して、相同性検索を実行できます。
遺伝子クラスターアラインメントを実行し、オーソログ遺伝子の近傍のシンテニー保存の様子を可視化することができます。
対応するレファレンスディレクトリーを使用して、ゲノム表示順を変更できます。マップは印刷や画像ファイルとして出力することができます
環状ゲノムマップ(Circular Genome Map)は、同心円上に単一ゲノム染色体あるいは近縁種同士の複数のゲノム染色体からのFeatureやContentおよびゲノム位置特異的な任意の数値データを比較描画する機能です。
それぞれのゲノム染色体の遺伝子等各Featureの分布状態や、塩基組成の変化などを表示することができます。
配置するFeatureやContentの同心円の順序は任意に変更可能です。
描画パラメータの設定は同心円毎に変更可能です。
環状ゲノムマップの直径や印刷用パラメータの変更も可能です。
環状ゲノムマップの印刷直接印刷以外に、PDF, PNG, EMFの各フォーマットでファイル出力可能です。
環状ゲノムマップの同心円上に描画される多数のフィーチャーは注釈が存在すれば、その注釈の種類により異なるカラーでそれぞれを分類表示することができます。
環状ゲノムマップに描画される配列ファイルは、メインカレントディレクトリーに表示されている順序で参照されます。このため、異なる多数の環状ゲノム配列を同一形式で描画することが容易に操作可能です。
環状ゲノムマップ上の一部をクリックすることにより、対応するメインフィーチャーマップの領域を表示させることが可能となっています。
環状ゲノムマップには、その中心に配列ファイル名と総塩基長(単一ゲノム染色体の時)が描画され、また周囲には塩基数目盛が表示されます。
目盛の開始位置塩基も変更可能です。 マップレイアウトは、レイアウトスタイルとして登録可能で、登録された環状ゲノムレイアウトスタイルは後で呼びだすことができます。
ABI, SCFのキャピラリーシーケンサからの出力ファイルを読み込んだ時に使用されるビューア・エディターです。
塩基配列だけでなく、トレース波形を表示します。
デスクリプションウィンドウは、フィーチャーのQualifierに値を入力・編集するためのウィンドウです。
フィーチャー上の右クリックで起動され、そのフィーチャーのQualifierをすべて編集することができます。
フィーチャーのPositionも変更できます。
フィーチャーが属するFeature Keyも変更可能です。
アミノ酸配列の二次構造などのプロファイルを並列表示するビューアです。個別のプロファイル表示の他に、トータルプロファイルの設計と表示、モティーフの表示などが可能です。
マルチプルアラインメントビューアは、塩基配列やアミノ酸配列のマルチプルアラインメントを表示するためのウィンドウです。
マルチプルアラインメントビューアは、相同性検索結果ダイアログなどから起動することができます。
分子系統樹ビューアは、遺伝子などの配列から分子系統樹を描画するツールです。
このビューアは、マルチプルアラインメントビューアから起動することができます。
アラインメントビューア(Alignment Viewer)は、GTの一次解析結果を表示し、二次解析などを実行するためのビューア・エディターです。
Alignment Viewerは、GTのメインウィンドウから起動することができます。
Alignment Viewerは、メニューバー、ツールボックス、および4つのペインから構成されています。
メニューバーはViewerウィンドウに固定されていますが、ツールボックスおよび4つのペインはウィンドウから取り外して、デスクトップ上の任意の位置に表示することができます。
ツールボックスは、非表示にもできます。
4種のペインは、上から、Navigation Pane, Feature Pane, Consensus Pane およびFragment Pane と呼んでいます。
Navigation Pane は、他の3つのペインのナビゲーションを行うための特殊なペインでゲノム全体にわたるスケールと選択された領域内のスケールの2段階のスケールを持っています。
Feature Pane は、IMCのメインフィーチャーマップに類似の機能をもち、IMCの多くの機能を実行することができます。
Consensus Pane は、Assembly 結果をコンティグとそれを構成するReadの配列アラインメントとして表示する機能や、Mapping 結果を参照ゲノム配列とReadの配列アラインメントとして表示する機能です。
Fragment Pane は、Consensus Paneをグラフィカルに表示する機能で、より俯瞰的にアセンブリやマッピングの様子を閲覧できます。
制限酵素地図を描画するためのウィンドウです。
メインフィーチャーマップと同様のフィーチャーマップも描画します。
ズーム、横スクロール、ゲル電気泳動図の表示が可能です。ズーム、横スクロール、ゲル電気泳動図の表示が可能です。
IMCは、クローニング実験の操作をコンピュータ上で実行できることに特徴があります。この際、特殊なデータは不要で、GenBankやEMBLなどの公的なデータベースから入手できる塩基配列データをそのままクローニングすることが可能です。クローニングは注釈付の配列をそのまま、制限酵素消化、PCRプライマー設計、PCR増幅、ライゲーションを実行できます。結果として得られるクローニング生産物はすべてGenBank/EMBLフォーマットで出力されます。Primer情報は塩基配列上に貼り付けられ保存されるるため、Primerの管理にも有用です。
IMCのインシリコクローニング機能を使って、PCやMac上でクローニングを行います。
連続実験が可能です。
ゲノムDNA配列を制限酵素で消化切断し、その断片をゲル電気泳動することや、開環したベクターにライゲーションすること、などが連続して実行できます。
IMCの制限酵素機能では、元のDNA塩基配列に注釈(Feature)が付加されていれば、その注釈を保持した状態で断片化することができます。
1つのFeatureが制限酵素で分割されてしまう場合には、そのFeature自体は継承されますが、状況によってはFeature Keyが自動的に変更されることがあります。
制限酵素消化断片の末端形状は、正しく保存されます。これにより、断片同士のライゲーションを行う際に、ライゲーション可能か否かをチェックします。
大腸菌において、メチル化部位が制限酵素消化に影響するか否かをチェックすることができます。
よく使用する制限酵素をマイセットとして登録しておくことも可能です。新たに提供された制限酵素を登録したり、使用されなくなった制限酵素を削除することも可能です。
IMCには種々のPCR Primer設計方法があります。
単純に 配列レーン 上の塩基配列や フィーチャーレーン の領域をドラッグした範囲を プライマー として登録する機能
フィーチャーレーン 上のフィーチャーや選択領域の内外を増幅するプライマーを設計する機能
一度に多数の領域を増幅するプライマーを一括して設計する機能(Iterate Design 機能つき:設計できなくなる領域がなくなるまで設計を繰り返す機能です)
参考
以下は、遺伝子クラスター設計 など複数のDNA断片を一度に クローニング するためのPrimer群を一括設計する機能です。デザインからクローニングまでを実行し、クローニングされた生成物をIMCにロードできます。
IMCのPCR反応機能では、登録されたプライマーセットのプライミング位置をゲノム塩基配列上から探索します。
両方のプライマーがゲノム上にプライミングサイトを持つ場合には、プライマーで挟まれた領域をPCR増幅します。
このとき、アデニンを1塩基突出させることも可能です。これはTAクローニングに使用されます。
テンプレートDNA配列に注釈(Feature)がついている場合は、増幅されたPCR産物にも注釈が継承されます。
複数のテンプレートDNA配列に対して、PCRを実行することも可能です。
PCR産物の配列で一群のコンティグ配列を検索し、PCR産物が2つのコンティグ同士を橋渡しする場合は、そのコンティグ同士を結合して一本の配列にします。
目的と概要
機能
制限事項
アルゴリズム
プラスミドマップの作成については、Plasmid Map Viewerをご覧ください。
DNA配列を制限酵素で消化断片化した場合、PCR増幅した場合、ライゲーションを行った場合には、それらの産物をゲル電気泳動した結果として表示することができます。
DNAフラグメント配列の末端を修飾することができます。
IMCが現在提供している末端修飾機能は以下の通りです。
ライゲーションなどにより、インサートされるDNA断片の両端が同じ制限酵素で切断された場合や、平滑末端を持つ場合は、インサートの向きを知るために最適な制限酵素候補をゲル電気泳動図で表示します。
ゲノム設計機能では、相同組換したい領域とインサート配列から、相同組換用のホモロジーアームを設計します。
この機能を使用して、設計されたホモロジーアームを持つインサート配列配列をゲノムに組換します。
分子生物学的によらず、情報操作による塩基配列処理
NGSによる大規模シーケンシングと従来のキャピラリーシーケンサによるシーケンシングについての情報です。
NGSのデータ解析は、GenomeTravelerで実行できます。
キャピラリーシーケンシングデータ解析は、IMCで実行できます。
シーケンサからのリード配列を相同性を用いて互いに結合し、コンセンサス配列を生成します。
NGSからの大規模リードアセンブリとキャピラリーシーケンサからのアセンブリがあります。
NGSリードのアセンブリは、GenomeTravelerにおいて実行できます。
キャピラリーシーケンサからのリードアセンブリは、IMCのツールin silico Assemblerで実行可能です。
ナノポア関連のアセンブリはGenomeTravelerから起動できます。
次世代シーケンサー(NGS)からのリードをアセンブリする機能です。
VelvetとOASESを使用しています。
この機能は以下のエディションに実装されています。
GenomeTravler
Nanopore Seqeuncer からのRead をアセンブルします。
canu および miniasm を使用しています。
この機能は以下のエディションで実行できます。
GenomeTraveler
キャピラリーシーケンサーからのRead のアセンブリ機能です。
この機能は以下のエディションに実装されています。
IMCGE, IMCAE
, IMCDS
, GenomeTraveler
シーケンサからのリードの品質管理をします。
精度のよくない領域のトリミングや、全体的に精度の低いリードの排除を行い、アセンブリの精度を高めます。
ゲノム塩基配列決定の最終フェーズであるフィニッシング機能を説明します。
遺伝子やゲノムの塩基組成解析、コドン解析、ORF抽出、アミノ酸翻訳、アミノ酸プロファイル解析、モティーフ解析などの説明です。
ゲノム塩基配列の塩基組成に関する解析を行います。
カレント配列ディレクトリーにロードされた配列ファイルに対してこの解析を実行できます。
Genome Analysis メニューのFeature Statistics機能は、現在ロードされている塩基配列ファイルのすべてのフィーチャーの塩基組成を出力します。
メインフィーチャーマップに表示できるコンテント・プロファイルレーンも塩基組成を表示する機能の一つです。
移動平均法による組成の変化をグラフで表示します。
コンテント・プロファイルレーンは環状ゲノムマップビューアにも実装されています。
「Cluster Design Checker」機能は、指定されたクラスターの塩基組成を評価し、予め設定された塩基組成の範囲にあるか否かをチェックします。
コーディング領域(CDS)のコドン組成、アミノ酸組成表を出力します。
カレント配列ディレクトリーにロードされた注釈付き配列ファイルに対してこの解析を実行できます。
Genome Analysis メニューにある「Show Codon Usage…」機能は、現在ロードされている配列中に同定されているすべてのCDSの個々のアミノ酸組成、コドン組成を出力するだけでなく、全CDSトータルのアミノ酸組成、コドン組成も出力できます。
Statistics機能でも、スタートコドンの種類をCDS別に出力します。
コドン置換機能「Change Codon」では、指定されたCodon Usageファイルに従って、コドンの組成を置換できます。
IMCでは、シンプルなORF候補抽出機能を提供しています。
カレント塩基配列の6個のフレーム上で、ストップコドンから次のストップコドンまでの領域で指定した塩基長以上を有するものを抽出します。
ORF候補は、CDSへ変換し、アミノ酸翻訳を行うことも可能です。
ORF候補領域が他のORF候補領域を包含する場合は、より塩基長の大きいのものを採用できます。
IMCでは、このほかに外部コマンドとして、Gene FindingプログラムであるAugustusおよびMetaGenomeAnnotatorを起動し、その結果を取り込むことができます。
また、Glimmerなどの遺伝子同定プログラムの出力結果をインポートして、カレント配列上にマッピングすることができます。
カレント塩基配列上のCDSフィーチャーの塩基配列をアミノ酸翻訳します。
カレント配列上の全CDS、選択された領域上のCDS,1個のCDSについて翻訳範囲を指定することができます。
各コドンは指定されたGenetic Tableに従って翻訳されます。
遺伝子のアミノ酸配列の二次構造をプロファイルとして表示する機能です。
アルファヘリックス、ベータシート、ターンなどの構造や、親水性指標、疎水性指標、表面性、チェーン柔軟性、などのプロファイルを並列に表示できます。
また、それらの指標を線形結合した総合指標を自由に作成することができます。
アミノ酸プロファイル解析のモティーフリストにモティーフが登録されている場合は、アミノ酸プロファイル表示ダイアログのアミノ酸配列上にモティーフの位置を表示できます。
アミノ酸モティーフ検索は、パターン検索機能から実行できます。
ゲノムアノテーションとは、ゲノムに注釈を加えることですが、より具体的には、ゲノム配列上に同定された特徴(Feature)の属性(Qualifier)を記述することです。
Featureの種類はFeature Key として分類されます。Featureの位置はPositionとして記録されます。ゲノム塩基配列上のPositionによって、そのFeatureが占める塩基配列が判ります。また、アミノ酸に翻訳されるコーディング領域(CDS)は、翻訳されたアミノ酸配列情報をGenetic Code Tableを介して間接的に保有することになります。CDSのようなフィーチャーは二重らせんのどちら側に特定されるかも重要で、通常はComplementという位置演算子を使って表記されています。
アノテーションを実行するには注釈が付加された塩基配列あるいはアミノ酸配列のデータベースを作成する必要があります。
IMCには、ゲノム配列をロードしただけで自動的にBlast検索用データベースを生成する機能があります。
この機能は、近縁種の未知ゲノムにアノテーションをするために使用することができます。
大規模なデータベースを生成する機能も実装されています。
CreateDB機能は、NCBIなどからダウンロードできるSuperKingdom別のファイルを使用して、ローカルBlast検索用データベースを生成します。
検索用データベースは、核酸配列とアミノ酸配列のいずれのデータベースも生成できます。
これらのファイルは非常にサイズが大きく、かつ多数あります。検索する場合は、多数の生成されたデータベースをジョインして一つのデータベース名として使用できます。
データベースを外部サーバ上に構築し、ネット経由で検索できるようにすることも可能です。
ゲノムアノテーションを全自動で行う機能です。
アノテーションを行うゲノム塩基配列を登録すると、そのゲノム配列へのアノテーションを全自動で行います。
実行前に使用する同定ソフトウェアや使用する配列データベースを選択することができます。
ゲノムアノテーション処理は計算量が多く、長時間がかかる場合が多いため、外部サーバ上でこれを実行し、結果を得ることが広く行われています。
また、ゲノムアノテーションに使用される遺伝子同定ソフトウェアはLinux上で動作するように開発されたものが多く、Windowsでは実行できない場合があります。
このような場合にも、外部Linuxサーバ上にそれらのソフトウェアをインストールしておき、アノテーションを行うメリットがあります。
MacOSXは、Linuxベースであるため、それらの同定ソフトウェアはMacのローカル環境でそのまま動作するものが多くなっています。
しかし、この場合も手動アノテーションを並行で行う際には、手動操作が遅くなるおそれがあり、Macの場合でも外部サーバ上でアノテーションを行うメリットがあります。
IMCでは、外部サーバ上にアノテーション用データベースを作成する機能があり、簡単にサーバ上に検索データベースを生成することができます。
IMCに搭載されたアノテーション用の機能を使用して 手動アノテーション を行うことができます。
IMCには以下のようなアノテーションツールが用意されています。
検索結果として絞り込まれたフィーチャーへの連番を付加することできます。
各フィーチャーがもつQualifierの1つを選択し、その値として連番が付加されます。
具体的には、フィーチャーキー検索、キーワード検索、ゲノム統計情報の各検索結果画面から操作できます。
また、カレントメインディレクトリ上にあり、選択された複数のゲノム配列上のフィーチャーへ統一された連番を付加することができます。
アノテーション実行中は多くの情報を参照して、特殊なフィーチャーやQualifierを使用することがあります。
また、命名や連番付加もアノテーション途中では一時的なものを使用使用せざる得ないことが多くなります。
しかし、アノテーションが終了すると、上記の情報の多くは不必要となり、かつ投稿する際には、エラーとなるものもあります。
IMCでは、アノテーションが終了した段階で、アノテーション結果を整理し、精製する機能をもっています。
以下にその主なものを挙げます。
![]() |
|
複数の核酸あるいはアミノ酸配列間のアラインメントを作成します。
メインカレントディレクトリにロードされている配列から複数選択可能です。
ホモロジー検索結果画面からもこの機能を起動できます。
結果画面からは、系統樹描画機能、シンプルエディター機能、クリップボードへのコピー、印刷が可能です。
1行に表示する文字数を変更できます。
ベン図(Venn Diagram)は集合論で使用される図で、3個の集合(4集合以上の場合も描画可能ですが、IMCでは3集合以下のみ描画します)間の要素の数の分布を示したものです。
それぞれの集合に属する要素を円内に示し、それらが重なり会う部分を共通要素として示します。
生物学への応用として近縁種ゲノム間の相同遺伝子の数を図示することに使用されます。
この機能は以下のソフトウェア・エディションに搭載されています
この機能は以下のソフトウェア・エディションに搭載されています
グローバルゲノム再配置マップの描画ウィンドウです。上部と下部にそれぞれ互いに近縁なゲノム配列が直線で表現されています。上下の線分を結ぶ多数のカラーの線分は上下のゲノムで互いに相同性の高いものを結んでいます。上下を結ぶ線分のカラーは、相同性の強さの違いを示しています。中央で1点に集まる線分はこの流域が互いのゲノムで逆位になっていることを示します。中央にある小さなウィンドウはナビゲーションウィンドウで全体をズームインした場合にどの部分が表示されているかを示します。上下にあるボタンツールで画面表示や出力を設定できます。
この機能は以下のソフトウェア・エディションに搭載されています
局所ゲノム再配置マップ(Local Genome Rearrangement Map)は、近縁種を比較する機能の1つです。2つゲノムの間の最大相同性パスに沿った相同性領域の比較を塩基配列やアミノ酸配列レベルでかつそれらゲノム上にある注釈を表示します。
この機能は以下のソフトウェア・エディションに搭載されています
基準となるゲノム上に、異なる近縁種ゲノムとの相同領域を検出し、塩基配列およびそれぞれのゲノムのフィーチャーをアラインメントした局所的ゲノム再配置マップを描画します。この機能を、ローカルゲノムリアレンジメントマップと名付けています。
2種の近縁種間の全体にわたり、かつ局所的なゲノムリアレンジメントマップを作成・描画します。
基準ゲノムに対して、比較対象としての近縁種のゲノム全域を写像します。
2種のゲノム間のゲノム全域にわたり、塩基配列レベルでの相同領域を表示します。
コーディング領域においては、対応するアミノ酸残基をアラインメント表示します。
アミノ酸残基の不一致個所をリスト表示し、そのリストの各不一致個所をクリックすることにより、対応する位置にマップを移動できます。
一致部位と残基のリストをCSVファイル出力可能です。
リストは再ロード時に、再現表示されます。相同領域においては双方のゲノムのフィーチャーとその位置をアラインメント表示します。
基準ゲノムとの相同性がない領域については、比較対象ゲノムのフィーチャーは表示されません。
これは、LGRMが基準ゲノムに対して比較対象ゲノムを写像するという原理から、写像されない領域すなわち、比較対象ゲノムから欠失した領域として判断されます。
解析結果は基準ゲノムのGenBank形式ファイルとして保存および再参照可能です。
LGRM表示設定をレイアウトスタイル(LGRMレーン)として登録可能です。
LGR Mapレーンはメインフィーチャーマップの任意に位置に配置設定できます。塩基配列とアミノ酸配列の比較表示をカスタマイズできますLGRMでは通常の配列レーンをLGRM用に読み替えて使用されます。
複数の注釈つきゲノム塩基配列ファイルから、それぞれのゲノムに存在するCDSに注釈つけられたEC番号の対照リストを表示します。
この機能は以下のソフトウェア・エディションに搭載されています
遺伝子クラスターアラインメントは、複数の近縁種ゲノムの1つの遺伝子に着目し、その近傍(上流にN個の遺伝子範囲、下流にN個の遺伝子範囲)を含めて、近縁種ゲノムとの間の相同性の有無を調べ、BBHがある場合には相同遺伝子同士を帯で結合表示するものです。
この機能は以下のソフトウェア・エディションに搭載されています
パンゲノムからコアゲノムを抽出します。
集団が大きい場合は計算時間がかかります。その場合は、コア数の多い計算機で実行することを推奨します。
この機能は以下のソフトウェア・エディションに搭載されています
変異点解析は近縁種ゲノム(パンゲノム)間の変異点を塩基単位で検出します。
この機能は以下のソフトウェア・エディションに搭載されています
実装エディション:IMCGE,AE
,DS
マルチプルアラインメント結果から、選択されたフィーチャ―の分子系統樹を描画します。
水平表示、垂直表示、無根系統樹の指定ができます。また進化距離の表示・非表示が可能です。
ノードの形状をBox, Circle, Noneから選択できます。
系統樹図は、PDF形式でファイル出力できます。外部で作成された系統樹ファイル(dnd形式)を読み込み、表示可能です。
ゲノム塩基配列(複数可能)上へ様々な配列をマッピングし、フィーチャーとして登録することが可能です。
マッピング可能な配列
フィーチャーマッピングは、エキスポートされたフィーチャーデータをゲノム配列上にマッピングし、そのゲノム配列のフィーチャーとして登録する機能です。
マッピングする位置を同定する方法は、フィーチャーの位置情報によるものと、フィーチャーの塩基配列を用いて、相同性検索により位置を同定する方法があります。
EST(cDNA)マッピングとは、EST(cDNA)塩基配列ファイルを、参照ゲノム塩基配列上にその相同性を利用してESTが由来するゲノム位置を同定し、その位置にEST(cDNA)フィーチャーを登録する機能です。
ESTライブラリーによっては、局所的に冗長度が高く、ゲノム上の同一部位に多数のESTフィーチャーがマッピングされる場合があります。
このような局所的に冗長度の高いESTマッピング結果をフィーチャーマップ上に描画するために、Pack Laneというフィーチャーレイアウト機能があります(詳細は、FLS:Feature Layout Style, Pack Laneを参照ください)。
ESTマッピングには、2種類あります。
トレース波形マッピングは、キャピラリーシーケンサーからのトレース波形データを由来するゲノム塩基配列上にマッピングする機能です。
トレース波形ビューアを使用すると、アラインメントされたトレース波形を閲覧することができます。
gbSNPやjSNPの変異データを対応するゲノム塩基配列上にマッピングする機能です。
アミノ酸配列を参照ゲノム塩基配列上にマッピングし、新規フィーチャーとして登録します。
指定したアミノ酸配列(複数可能)を、現在フィーチャーマップとして表示されている参照ゲノム上にマッピングし、ヒットしたエントリーを新規フィーチャー(mRNAなど)として登録します。
マッピングには、tBlastNのアルゴリズムが使用されます。
マッピング結果は、3タイプに分類されます。
前者2タイプの結果は、参照ゲノム上に新規フィーチャーとして登録することができます。たとえば、完全マッチ配列を、mRNAフィーチャーとして登録し、不完全マッチ配列は、miscRNAフィーチャーとして登録することができます。
新規登録されるフィーチャーの任意のQualifierに同一のValueを設定できます。また、Qualifier /locus_idに指定した接頭文字と、任意の桁数をもち、任意の数値から開始される連番を登録することができます。
イントロンをもつ真核生物の場合は、エクソン・イントロン領域を識別してマフィーチャー登録されます。
イントロンの最大塩基長を制限できます。
アレイ解析を実行する前に、対象ゲノム塩基配列に対して、タイリングアレイプローブをマッピングし、各プローブのゲノム上の位置と情報をフィーチャーとして登録しておく必要があります。
アレイの発現データは、プローブ毎に得られるため、発現ファイルをロードすると、個々の発現量情報は、各プローブのフィーチャー上に転記されます。
IMCでは、ゲノム配列上に同定された各CDSフィーチャーのBlast検索結果をそれぞれのフィーチャーのQualifierとして保存することができます。
外部のサーバなどでBlast検索した結果をBlast検索結果マッピング機能を使用して、カレントゲノム配列にマッピングすることにより、これらの相同性検索結果を各CDSフィーチャー上に書き込むことができます。
予めFeature Key Search結果をエキスポートし、それらをクエリー配列として使用することにより、Blast検索結果を正しくマッピングすることができます。
次世代シーケンサー(NGS)のReadをゲノム上にマッピングする機能です。
以下のソフトウェアに実装されています。
GenomeTraveler
この機能は以下のエディションで実行できます。
AE, DS
, GT
タイリングアレイプローブを自動設計します。
プローブ塩基長を指定できます。
各プローブの先頭塩基同士の距離(塩基数)を指定できます。
プローブを設計するストランドを指定できます(Forward Strand, Reverse Strand, Both)。rRNAなどの指定した注釈(フィーチャーキー)を避けて、プローブを設計できます。
プローブが設計された位置に何らかの注釈がある場合、その内容を取り込むことが可能です。
プローブ名に任意の頭文字(プレフィックス)および指定桁数の連番を指定可能です。
現在は3種のフォーマットで出力可能です。
この機能は以下のエディションで実行できます。
AE, DS
, GT
注釈付塩基配列ファイルにプローブを貼り付ける機能です。注釈付塩基配列ファイルにプローブを貼り付ける機能です。
プローブファイルを読込、カレントゲノム配列上の由来する位置にマッピングすることができます。
ゲノム上の位置情報が存在する場合は、各プローブの位置情報を基に対応するゲノム位置にプローブフィーチャーを貼り付けます。
位置情報が存在せず、プローブの塩基配列のみが与えられている場合は、プローブ塩基配列の相同性によりマッピングを行います。
現在マッピングできるプローブは以下のアレイメーカーのものです。
この機能は以下のエディションで実行できます。
AE, DS
, GT
タイリングアレイ発現データファイルやNGSのRNA-Seqファイルをインポートし、アレイ解析に使用できるようにします。
インポートできる発現データファイル数には制限がありませんが、一度の操作でインポートできるのは10ファイルまでです。
この機能を実行する前に、プローブマッピングを実行しておく必要があります。
ゲノム塩基配列ファイルをロードし、プローブファイルをマッピングし、発現データファイルをインポートする一連の処理をバッチ処理として登録し、バックグラウンドで実行できます。
プローブ毎の発現量は、メインフィーチャーマップのアレイプロファイルレーン上に棒グラフあるいは折れ線グラフで表示できます。
同時に表示するレーン数には制限がありませんが、レーン数を多くするとそれだけ多くメモリーを消費します。
発現プロファイルレーンはメインフィーチャーマップ上にいくつでも表示することができます。
また、その位置関係を上下に自由に移動できます。
クローニング操作により、発現プロファイルをもつゲノム配列が消化切断、増幅、ライゲーションなどされた場合は、その領域に属する発現プロファイルも継承されます。
この機能は以下のソフトウェア・エディションに搭載されています
IMCAE, IMCDS
, GenomeTraveler
発現プロファイルレーン上では以下の操作を実行できます。
発現プロファイルデータの補正を行う機能です。
データ補正機能には以下があります。
これらのデータ補正は、複数の補正項目を自由な順序で実行するパイプライン処理を行います。
これらのデータ補正の適用状態は、
発現データファイル毎にリスト表示できます。
これらのデータ補正の結果の補正値の統計数を発現データファイル毎にリスト表示できます。
データ補正前と補正後の発現量の分布をグラフ表示することができます。
この機能は以下のエディションで実行できます。
AE, DS
, GT
タイリングアレイは、遺伝子より短いプローブで遺伝子上や遺伝子間にほぼ等間隔で複数個のプローブが設計されます。
また、計測される一次データは、各プローブ毎の発現量となります。
このため、1つの遺伝子上に着目すると、そこには複数のプローブと複数の発現量が得られます。
この機能は、遺伝子上に配置されたプローブの発現量を遺伝子の発現量に変換するものです。
この機能は以下のエディションで実行できます。
AE, DS
, GT
アレイ間の四則演算を実行し、その結果をプロファイルレーンに表示します。
最大3アレイ間の演算が可能です。
この機能は以下のエディションで実行できます。
AE, DS
, GT
発現プロファイルからピーク検出を実行します。
検出結果はピークリストダイアログにリスト表示されます。
リストはCSVファイルとしてファイル保存できます。
リストをクリックすると、メインフィーチャーマップがその位置を中央に表示するように自動スクロールします。
この機能は以下のエディションで実行できます。
AE, DS
, GT
任意のアレイ間の発現量の相関をプロットします。
この機能は以下のエディションで実行できます。
AE, DS
, GT
遺伝子発現量のクラスタリングを行います。
クラスタリングの結果は、デンドログラムおよびヒートマップとして表示できます。
この機能は以下のエディションで実行できます。
AE, DS
, GT
現在インポートされている発現量データファイルに関して、フィーチャー別の発現量をリストアップします。
表示するフィーチャーは、選択できます(複数選択可能)。
リストは、カラム別に4つまでのソートキーでソートすることが可能です。
この機能は以下のエディションで実行できます。
AE, DS
, GT
代謝解析のソリューションです。
ゲノム設計のソリューションです。
異種宿主への組換用遺伝子組成設計について
コドン置換
組成自動設計
遺伝子レベルのデザインについて
遺伝子クラスターが正しく設計されていかを検査する機能です。
OGAB法でクラスターを再構築するための遺伝子クラスター配列断片化設計を行います。
相同組換のための、ホモロジーアームの設計と、ホモロジーアーム増幅のためのPCR Primer設計を行います。
また、インサート配列とホモロジーアームをデザインした後、実際にゲノムへの相同組換を実行します。
ウィンドウ・ダイアログ別の説明です
解析などの実行を指示するダイアログです。
実行や表示などのオプションパラメータ設定を行うダイアログです。
検索や解析結果を表示するためのダイアログです。
in silico Assemblerはde novo Assemblerです。
50bp以上のDNA Fragmentをアセンブリできます。
主として、キャピラリーシーケンサーからのRead のアセンブリに使用されます。
NGSからのReadもアセンブリ可能です(100万Read程度まで。それ以上のサイズはVelvetなどをお使いください)
前処理で処理件数限定、最低QVの指定、最大N塩基数の限定が可能です。
iSpiderは、外部の塩基配列やアミノ酸配列データベースサーバから必要な配列データファイルをダウンロードするツールです。
予め、外部サーバとそこから取得する配列データの情報を登録しておくことにより、簡単に最新の配列データをダウンロードし、所定のディレクトリーに保存することができます。
手動ですぐにダウンロードを実行することが可能ですが、実行する日時を指定してその時刻に自動的にダウンロードすることも可能です。
正規表現で、複数のファイルを指定することが可能であるため、場合によってはかなり多数のファイルをダウンロードすることになります。
外部サーバの規約に従って、サーバにあまり負荷をかけないよう設定を行ってください。
TaxiSpiderは、iSpiderの姉妹ツールです。
塩基配列ファイルやアミノ酸配列ファイルへの全索引を指定したサイトからダウンロードするツールですが、それらの配列索引を1つの大きなTaxonomy Tree状のデータベースに格納していくことに特徴があります。
ダウンロードされた配列データはそのTaxonomy情報に従って、Taxonomy Treeの該当する枝上に格納されます。
ただし、ローカルに非常に大きなディスクスペースを必要とします。
2018年12月現在、47GBのディスクスペースが必要です。
ARMは、代謝パスウェイのエディター・ビューアです。
アトムトレース機能があり、炭素、酸素、硫黄原子を追跡することができます。
ソース化合物からターゲット化合物までのすべてのシングルパスウェイを探索することができます。
ただし、化合物や反応のデータが古いため、最近のパスウェイは含まれていませんが、化合物や反応を追加登録することが可能です。
探索されたパスウェイをカンバス上で、自動的に結合し、合成パスウェイを描画することができます。
オリジナルな機能に、以下の新しい機能も追加されています。
メタボローム解析などから得られる化合物別の量的データをインポートし、各化合物の上に系列表示(棒グラフ)できます。
また、トランスクリプトーム解析から得られる酵素遺伝子の発現量データをそれぞれの反応上に系列表示(棒グラフ)できます。
ARMは、東京大学(現国立遺伝学研究所)の有田さんが開発したソフトウェアです。
対話型のARMインターフェイスです。
ARMのシングルパスウェイ探索機能を対話形式で実行できます。
ARMは、東京大学(現国立遺伝学研究所)の有田さんが開発したソフトウェアです。
NGSのペアドエンドReadをフラグメントに変換します。
GenBank GBFF Expanderは、多数のゲノム配列を含むNCBIのGBFF形式のファイルを個々のゲノム配列に展開し、そのTaxomyに従って、ツリー上のディレクトリーに配置するツールです。
TaxiSpiderのプロトタイプとなった機能です。
IMCで使用するゲノム塩基配列ファイルの主たるフォーマットであるGenBank EMBL形式ファイルが正しいか検査し、誤りがあればそれを自動的に修正します。
1つのディレクトリー以下に複数のGenBank EMBLファイルを保存しておくと、そこにある全部のファイルをチェックします。
また、検査結果ファイルは別のディレクトリーに保存できます。
ゲノムトラベラーの機能と操作をここにまとめます。
それぞれの機能別の記述と重複する場合があります。
GTのデータ管理とプロジェクト管理について説明です。
NGS データの前処理についての説明です。
GTによるde novo アセンブリについての説明です。
GTにおけるNGSデータのマッピングについての説明です。
GTのアラインメントビューアについての説明です。
GenomeTravelerのスキャフォールディング機能についての説明です。