2012-04-30 12 views
2

私はfastq形式で読み込みをトリミングするためのツールをたくさん見つけましたが、すでに整列された読み込みをトリミングするためのツールはありますか?Trim Illuminaはbam/samファイルを読み込みます

+0

1:http://www.biostars.org/トリミングの意味は?私はfastaファイルとfastqファイルを常に使用していますが、あなたが何を求めているのか分かりません。 – flies

+1

トリミングとは、特定の基準に基づいて配列の末端から塩基を除去することを意味します。それは単純に各端から設定された数でもよいし、fastqの場合には品質に基づいていてもよい。 TrimmomaticとFastXツールキットはfastqのためにこれを行うことができますが、私はbamファイルでそれを行うための何かを探しています。 – JoshuaA

答えて

0

アライメントをトリミングプロトコルに通知したいのですか、または品質値などのトリミングをしたいですか? 1つのアプローチは、簡単にFASTQに変換してから、無数の従来のトリミングオプションを使用することです。あなたはピカードでこれを行うことができます。

http://picard.sourceforge.net/command-line-overview.shtml#SamToFastq

+0

アライメントがトリミングプロトコルに通知された場合は、私は好きです。私がこれをやりたいと思うのは、RNAseqの読み込みだから、分裂した読みを考慮する必要があります。読み取りと品質スコアを単純に調整するために何かを書くことができましたが、CIGAR文字列を考慮しながら配置を更新するのはちょっと難しいようです。 – JoshuaA

2

私は個人のトリミング阻止するだろうことは、あなたはあなたがトリミングしようとしているシーケンスは、アダプター配列である場合は特に読み整列させた後に読み込みます。

これらのアダプター配列が存在すると、読み込みがゲノムに正しく整列できなくなります(私の経験からはるかに低い整列率が得られます)。アラインメントが既に不正確であるため、アライメント後のシーケンスをトリムすること(ガーベッジ・イン、ゴミ・アウト)は全く無意味です。

fastqファイルを整列する前にトリミングする方がずっと良いでしょう。

+0

提案していただきありがとうございます。私はこのようにやってしまった。 – JoshuaA

0

1つの可能性は、ClipReadsなどのGATKツールセットを使用することです。アダプターを削除する場合は、ReadAdaptorTrimmerを使用できます。 fastqに変換するバックは必要ありません(Documantation:http://www.broadinstitute.org/gatk/gatkdocs/)。

ピカードは、もちろん別の可能性があります。

関連する問題