アルゴリズムとデータ構造
アルゴリズム
- LGRMには、2つの近縁のゲノム配列を使用します。
- 一方を基準ゲノム配列と呼び、もう一方を比較対照ゲノム配列と呼びます。
- おおまかには、基準ゲノムに対して比較対象ゲノムを核酸配列の相同性によりマッピングを実行し、基準ゲノム上にその結果を貼り付け、それをLGRレーンとして表示します。
- 解析の流れは以下の通りです。
-
- 2つのゲノム間のDotPlot解析を行い、主たる相同パスを決定します。
- 基準ゲノムに対して、比較対照ゲノムをクエリーとする相同性検索を行います。
- この相同性検索には、NCBI BlastNを使用しています。
- 相同性検索から得られた相同パス上のセグメントとのペアワイズアラインメントを実行します。
- セグメント別に基準ゲノム塩基に対する比較対照ゲノム塩基配列の挿入および欠失の部位を記録します。
- それぞれのセグメントを基準ゲノム配列上の特殊なFeature Key (lgrm_segment)として登録します。
- 比較対照ゲノムの各セグメント領域上にある各Featureは、基準ゲノム上のLGRM Featureとして登録します。
- 保存されたLGRM配列ファイル(GenBankフォーマット)の再読み込み
- Feature Layout StyleにLGRMの指定があるか否かを判定する。
- LGRM指定がある場合は、配列レーンをLGRM形式で表示し、lgrm_segment上の配列を比較参照塩基レーンに表示する。
- LGR Mapレーンがある場合には、lgrm FeatureをLGR Mapレーン上に表示する。
データ保持方法
- LGRMの解析結果は、すべて基準ゲノム上のFeature部に記録されます。
- 比較対照ゲノム上の基準ゲノムに相同な領域はそれぞれlgrm_segmentという特殊なFeature Keyに属するフィーチャーとして記録されます。
- 比較対照ゲノム上に存在し、基準ゲノムに相同な塩基配列領域上にある各フィーチャーは基準ゲノム上のフィーチャーとして記録されます。これら比較対照ゲノムに属するフィーチャーには、/lgrm_orderという特殊Qualifierが付加されます。