ゲノム解析ソフトウェア技術情報サイト

インシリコバイオロジー株式会社 公式技術情報サイト

機能メニュー

ようこそ, ゲスト
ユーザ名: パスワード: シークレットキー 自動ログイン
  • ページ:
  • 1
  • 2

トピック:

GTでのコンセンサス配列の作り方 12 年 10 ヶ月 前 #515

基本的な質問ですいません。マッピングした結果から、コンセンサス配列を作る際、contig.consなどで大文字のATGCと小文字のatgcは区別されているのだと思いますが、これはどのような違いでしょうか?qualityを反映しているのでしょうか。マッピングは、他のプログラムで出力されたBAM fileをインポートしています。どうぞ、よろしくお願いします。

ログイン は対話に参加してください。

最終編集: : HKoike.

Re: GTでのコンセンサス配列の作り方 12 年 10 ヶ月 前 #516

SAM/BAMファイルからのインポートの場合は、Soft Clipping領域の塩基を小文字(a,c,g,t)で表記しています。
ちなみに、GTのマッピング結果の場合は、Referenceに対してアラインメントできた領域の塩基を大文字(A,C,G,T)で、それ以外の領域の塩基を小文字で表記しています。

ログイン は対話に参加してください。

Re: GTでのコンセンサス配列の作り方 12 年 10 ヶ月 前 #527

コンセンサスが書かれた、contig.consでは、a,A,c,C,g,G,t,Gの他に、その他(塩基N)の数が出力されていますが、SAM/BAMファイルからのインポートの場合は、どのような場合にNと数えられるのでしょうか?
SAM/BAMで既にNとなっているのでしょうか? それともGTで変換などがあるのでしょうか? 五月雨式にいろいろと訊いて申し訳ありませんが、どうぞ、よろしくお願いします。

ログイン は対話に参加してください。

Re: GTでのコンセンサス配列の作り方 12 年 10 ヶ月 前 #528

SAM/BAMインポート時にコンセンサス配列を独自に決定しています。
決定方法は以下の2種類から選択できます。
1.多数決による方法=一番多い塩基をコンセンサス塩基とする。
2.最高Qualityによる方法
そのほかに、
Consensus Ratioというパラメータがあり、これで一番多い塩基の全体に占める必要最低割合を指定します。
もっとも多数の塩基がこの数値以上を占めるとその塩基がコールされますが、それ以下ではNとなります。

ログイン は対話に参加してください。

Re: GTでのコンセンサス配列の作り方 12 年 10 ヶ月 前 #529

GTのコンセンサスに関する資料を添付します。
添付ファイル:

ログイン は対話に参加してください。

Re: GTでのコンセンサス配列の作り方 12 年 10 ヶ月 前 #531

お返事、ありがとう御座いました。コンセンサスの配列を決定する以前の、contig.consのcolumn10、その他(塩基 N)の数の「N」も、コンセンサスを作る場合の多数決の結果が反映されているのでしょうか? contig.consのファイルを見た時に、column01 - column10まではコンセンサスの決定の基にするデータ(SAM/BAMから来たデータ)で、GTでのコンセンサス決定の結果が、column11以降に書かれているように思っていました。 それとも、コンセンサスの決定時の結果が、column10に書かれているのでしょうか?
勘違いがあったら申し訳ないのですが、お答え頂いたnは、column12のnについてのように感じたのですが。どうぞ、よろしくお願いします。

ログイン は対話に参加してください。

  • ページ:
  • 1
  • 2
ページ作成時間: 0.040 秒

Site Seal

最新更新記事