Genome Analysis Software Info Site

Official Technology Information Site of in silico biology, inc.

Welcome, Guest
Username: Password: Secret Key Remember me
  • Page:
  • 1
  • 2

TOPIC:

GTでのコンセンサス配列の作り方 12 years 10 months ago #515

  • HKoike
  • HKoike's Avatar Topic Author
  • Online
  • Posts: 5
基本的な質問ですいません。マッピングした結果から、コンセンサス配列を作る際、contig.consなどで大文字のATGCと小文字のatgcは区別されているのだと思いますが、これはどのような違いでしょうか?qualityを反映しているのでしょうか。マッピングは、他のプログラムで出力されたBAM fileをインポートしています。どうぞ、よろしくお願いします。

Please Log in to join the conversation.

Last edit: by HKoike.

Re: GTでのコンセンサス配列の作り方 12 years 10 months ago #516

  • akr-sp-1212728882
  • akr-sp-1212728882's Avatar
  • Online
  • Posts: 395
SAM/BAMファイルからのインポートの場合は、Soft Clipping領域の塩基を小文字(a,c,g,t)で表記しています。
ちなみに、GTのマッピング結果の場合は、Referenceに対してアラインメントできた領域の塩基を大文字(A,C,G,T)で、それ以外の領域の塩基を小文字で表記しています。

Please Log in to join the conversation.

Re: GTでのコンセンサス配列の作り方 12 years 10 months ago #527

  • HKoike
  • HKoike's Avatar Topic Author
  • Online
  • Posts: 5
コンセンサスが書かれた、contig.consでは、a,A,c,C,g,G,t,Gの他に、その他(塩基N)の数が出力されていますが、SAM/BAMファイルからのインポートの場合は、どのような場合にNと数えられるのでしょうか?
SAM/BAMで既にNとなっているのでしょうか? それともGTで変換などがあるのでしょうか? 五月雨式にいろいろと訊いて申し訳ありませんが、どうぞ、よろしくお願いします。

Please Log in to join the conversation.

Re: GTでのコンセンサス配列の作り方 12 years 10 months ago #528

  • akr-sp-1212728882
  • akr-sp-1212728882's Avatar
  • Online
  • Posts: 395
SAM/BAMインポート時にコンセンサス配列を独自に決定しています。
決定方法は以下の2種類から選択できます。
1.多数決による方法=一番多い塩基をコンセンサス塩基とする。
2.最高Qualityによる方法
そのほかに、
Consensus Ratioというパラメータがあり、これで一番多い塩基の全体に占める必要最低割合を指定します。
もっとも多数の塩基がこの数値以上を占めるとその塩基がコールされますが、それ以下ではNとなります。

Please Log in to join the conversation.

Re: GTでのコンセンサス配列の作り方 12 years 10 months ago #529

GTのコンセンサスに関する資料を添付します。
Attachments:

Please Log in to join the conversation.

Re: GTでのコンセンサス配列の作り方 12 years 10 months ago #531

  • HKoike
  • HKoike's Avatar Topic Author
  • Online
  • Posts: 5
お返事、ありがとう御座いました。コンセンサスの配列を決定する以前の、contig.consのcolumn10、その他(塩基 N)の数の「N」も、コンセンサスを作る場合の多数決の結果が反映されているのでしょうか? contig.consのファイルを見た時に、column01 - column10まではコンセンサスの決定の基にするデータ(SAM/BAMから来たデータ)で、GTでのコンセンサス決定の結果が、column11以降に書かれているように思っていました。 それとも、コンセンサスの決定時の結果が、column10に書かれているのでしょうか?
勘違いがあったら申し訳ないのですが、お答え頂いたnは、column12のnについてのように感じたのですが。どうぞ、よろしくお願いします。

Please Log in to join the conversation.

  • Page:
  • 1
  • 2
Time to create page: 0.034 seconds