>コンセンサスの配列を決定する以前の、contig.consのcolumn10、その他(塩基 N)の数の
>「N」も、コンセンサスを作る場合の多数決の結果が反映されているのでしょうか?
コンセンサスの決定にはcolum10「その他(塩基N)の数)は反映されません。
column01 ...塩基 a の数
column02 ...塩基 A の数
column03 ...塩基 c の数
column04 ...塩基 C の数
column05 ...塩基 g の数
column06 ...塩基 G の数
column07 ...塩基 t の数
column08 ...塩基 T の数
column09 ...ギャップの数
column10 ...その他(塩基 N)の数
column11 ...規定塩基
column12 ...ベースコール結果
>その他(塩基N)の数が出力されていますが、SAM/BAMファイルからのインポートの場合は、
>どのような場合にNと数えられるのでしょうか?
SAM/BAMファイルインポート時にcolumn10 その他(塩基 N)の数ががカウントされるのは
Hard Clippingによるものです。
たとえは、塩基配列が「gcctaAGCTAA」で、SAMRecordのCigarが「5H6M」となっている場合、
GTでは「gcctaAGCTAA」は「nnnnnAGCTAA」変換されます。