ベン図(Venn Diagram)の機能と操作
ベン図(Venn Diagram)とは?
ベン図(Venn Diagram)は集合論で使用される図で、3個の集合(4集合の場合も一般的には描画可能ですが、IMCでは3集合以下のみ描画します)間の要素の数の分布を示したものです。それぞれの集合に属する要素を円内に示し、それらが重なり会う部分を共通要素として示します。生物学への応用として近縁種ゲノム間の相同遺伝子の数を図示すことに使用されます。
機能 と特徴
- すでに遺伝子が同定された3株の近縁種ゲノム塩基配列についてそれらのGenBank形式ファイルを使い、それぞれのゲノム上に存在するすべての遺伝子の間に共通遺伝子か否かを判定し、3ゲノム間あるいは2ゲノム間のベン図(Venn Diagram)を描画します。
- 共通遺伝子の判定には、NCBI Blastによるアミノ酸配列性検索を使用します。
- 判定基準は、Blast結果のPercent IdentityとOverlap Lengthを使用します。
- Percent IdentityとOverlap Lengthが指定値以上の組をそれぞれが共通と定義します。
- Venn Diagramをカラーグラフィック描画します。
- 各数値をクリックするとその遺伝子リストを表示します。
- 描画色を変更することが可能です。
- 印刷が可能です。
- 共通遺伝子等のリストを表示、ファイル出力します。
- 3種に共通な遺伝子数とそのリスト
- 3種のうち、いずれかの2種に共通な遺伝子数とそのリスト
- そのゲノムのみに存在し、他の2種ゲノムに共通な遺伝子が存在しない遺伝子の数とそのリスト
- 各リストはCSVファイルとして出力できます。
- 共通遺伝子あるいはユニーク遺伝子に関して、遺伝子フィーチャーアラインメントします。
- リスト上の各共通遺伝子あるいはユニーク遺伝子をクリックすることにより、MGV(参照ゲノムマップ)上の各ゲノムをその遺伝子位置で遺伝子フィーチャーアラインメントします。
制限事項
- Venn Diagram機能は、IMC GE/AEに実装されています。IMCSEには実装されていません。
- Venn Diagramの描画対象ゲノムはすべてMGV上にロードしておく必要があります。
操作方法
準備
- MGV (=Reference Map) に2株以上の近縁種ゲノム塩基配列ファイルを読み込みます。
- MGVに解析対象ゲノムを読み込むのは、ゲノム間アラインメントを実行するためです。
実行手順
- Venn Diagram ボタンをクリックします。
- Venn Diagram Setting ダイアログが表示されます。
- Multiple Genome Viewer(MGV) MapにロードされているGenBankファイルのリストが表示されます。
- リストからVENN Diagramの対象ゲノムを3個までチェックします。
- Setボタンをクリックします。
- Venn Diagram 実行プログレスメッセージが表示されます。
- 処理が終了するまで、ゲノムの大きさによっては、数分から数十分かかる場合があります。
タブ切換操作
- 結果表示ダイアログの上部タブをクリックします。
- 表示内容を切り替えることができます。
3ゲノム共通リストの表示
- 3ゲノム間のVenn Diagramを構成する共通遺伝子およびユニーク遺伝子のリストです。
- 全部で7個のリストから構成されており、これは3ゲノム間Venn Diagram の7個の領域に対応しています。
3ゲノム間の共通遺伝子リスト(上リストのBi-Directional Hit)(遺伝子数)
- ゲノム1で、ゲノム2、3に対してユニークな遺伝子リスト(上リストのNo Hit NC_000915)(遺伝子数)
- ゲノム2で、ゲノム3、1に対してユニークな遺伝子リスト(上リストのNo Hit NC_000921)(遺伝子数)
- ゲノム3で、ゲノム1、3に対してユニークな遺伝子リスト(上リストのNo Hit NC_014560)(遺伝子数)
- ゲノム1とゲノム2の間で共通で、ゲノム3には共通遺伝子をもたない遺伝子リスト(上リストのNC_000915-NC_000921)(遺伝子数)
- ゲノム2とゲノム3の間で共通で、ゲノム1には共通遺伝子をもたない遺伝子リスト(上リストのNC_000921-NC_014560)(遺伝子数)
- ゲノム3とゲノム1の間で共通で、ゲノム2には共通遺伝子をもたない遺伝子リスト(上リストのNC_014560-NC_000915)(遺伝子数)
3ゲノム間共通遺伝子リスト
- No.: ゲノム1上の上流から数えた共通あるいはユニーク遺伝子の連番。
ゲノム1
- gene: ゲノム1上の遺伝子に注釈された遺伝子名。
- locus_tag : その遺伝子に注釈づけられたlocus_tag。
- protein_id: 例。この表示項目はQualifierリストから自由に選択できます。
- Start: この共通遺伝子に属するゲノム1上の遺伝子の開始位置
- End: この共通遺伝子に属するゲノム1上の遺伝子の終了位置
- Strand: この共通遺伝子に属するゲノム1上の遺伝子が乗っているStrand
- Identity: ゲノム1とゲノム2の遺伝子間のアミノ酸残基一致度
ゲノム2
- gene: ゲノム2上の遺伝子に注釈された遺伝子名。
- locus_tag: ゲノム2上の遺伝子に注釈づけられたlocus_tag。
- protein_id: 例。この表示項目はQualifierリストから自由に選択できます。
- Start: この共通遺伝子に属するゲノム2上の遺伝子の開始位置
- End: この共通遺伝子に属するゲノム2上の遺伝子の終了位置
- Strand: この共通遺伝子に属するゲノム2上の遺伝子が乗っているStrand
- Identity: ゲノム2とゲノム3の遺伝子間のアミノ酸残基一致度
ゲノム3
- gene: ゲノム3上の遺伝子に注釈された遺伝子名。
- locus_tag: ゲノム3上の遺伝子に注釈づけられたlocus_tag。
- protein_id: 例。この表示項目はQualifierリストから自由に選択できます。
- Start: この共通遺伝子に属するゲノム3上の遺伝子の開始位置
- End: この共通遺伝子に属するゲノム3上の遺伝子の終了位置
- Strand: この共通遺伝子に属するゲノム3上の遺伝子が乗っているStrand
- Identity: ゲノム3とゲノム1の遺伝子間のアミノ酸残基一致度
任意の2つのゲノム間の共通相同遺伝子リスト表示
2ゲノム間共通遺伝子リストは3種類作成され、それぞれのタブをクリックすることで開くことができます。
- No.: ゲノム1上の上流から数えた共通あるいはユニーク遺伝子の連番。
ゲノム1
- gene: ゲノム1上の遺伝子に注釈された遺伝子名。
- locus_tag: その遺伝子に注釈づけられたlocus_tag。
- protein_id: 例。この表示項目はQualifierリストから自由に選択できます。
- Start: この共通遺伝子に属するゲノム1上の遺伝子の開始位置
- End: この共通遺伝子に属するゲノム1上の遺伝子の終了位置
- Strand: この共通遺伝子に属するゲノム1上の遺伝子が乗っているStrand
- Identity: ゲノム1とゲノム2の遺伝子間のアミノ酸残基一致度
ゲノム2
- gene: ゲノム2上の遺伝子に注釈された遺伝子名。
- locus_tag: ゲノム2上の遺伝子に注釈づけられたlocus_tag。
- protein_id: 例。この表示項目はQualifierリストから自由に選択できます。
- Start: この共通遺伝子に属するゲノム2上の遺伝子の開始位置
- End: この共通遺伝子に属するゲノム2上の遺伝子の終了位置
- Strand: この共通遺伝子に属するゲノム2上の遺伝子が乗っているStrand
- Identity: ゲノム2とゲノム1の遺伝子間のアミノ酸残基一致度
各円の描画色および文字色の変更
以下の描画色を変更可能です。
- ゲノム1の描画カラーの変更
- ゲノム2の描画カラーの変更
- ゲノム3の描画カラーの変更
数値の文字カラーの変更
- 各カラーボックスをクリックします。
- カラーパレットが表示されます。
- 変更するカラーを選択します。
- パレットのカラーが変更されます。
- "Show" をクリックします。
- 描画色の変更が反映されます。
共通遺伝子の参照ゲノムマップ対応位置および同位置でのゲノムアラインメント表示
- 各共通遺伝子リストの各行をクリックします。
- 各ゲノムの対応する遺伝子がアラインメントされ、Multiple Genome Viewerに表示されます。
- 2ゲノムに共通な遺伝子や、1ゲノムだけに存在するユニーク遺伝子からもMultiple Genome Viewer上のその遺伝子位置を表示し、ハイライトします。
Venn Diagram図形の印刷
- Venn Diagramが表示されているウィンドウの下部にあるボタンを使用して印刷します。
- Pageの設定を変更する --> Page Setupボタンをクリックする
- Printerに直接印刷する --> Printボタンをクリックする
- 印刷イメージを[[PDF]]ファイルで出力する --> PDFボタンをクリックする
- 印刷イメージを[[PNG]]ファイルで出力する --> PNGボタンをクリックする
- 印刷イメージを[[EMF]]ファイルで出力する --> EMFボタンをクリックする
共通遺伝子およびユニーク遺伝子リストのCSVファイル出力
- 各遺伝子リストのタブを選択した後、下部のCSVボタンをクリックします。
- 出力ファイル指定ダイアログが表示されます。
- ファイル名とディレクトリ(フォルダー)名を指定します。
- 出力ファイルはMS Excelで閲覧・加工できます。
過去にVENN Diagramを実行した結果の読み込みと表示
- VENN Diagram実行ボタンをクリックします。
- VENN Diagram実行ダイアログが表示されます。
- "Read..."をクリックします。
- 過去に実行したVENN Diagram結果ファイルを指定します。
- 「Yes(Y)」をクリックします。
アルゴリズム
- 比較するゲノム上に同定されたCDSのアミノ酸配列をNCBI Blastの相動性検索を利用して比較します。
- 2ゲノムの比較の場合は、一方のゲノム上の1つのCDSが他のゲノムの全CDSに対してアミノ酸配列相動性検索を行い、さらにそのトップヒットCDSが元のゲノムのクエリーCDSと一致する場合に、共通遺伝子であると定義します。
- ただし、指定条件(Percent IdentityとOverlap Length)が判定基準値以下である場合には、棄却されます。