2017-02-17 7 views
0

どのようにペアの終わりのfastqファイルをループできますか?シングルエンドのためにあなたは私が1ペアエンドファイルを編集した場合、私は何とか2つのファイルが互いにペアの終わりのfastqの読み取りをループする

とよく対応していきように、第2のファイルを追跡する必要がある、しかし次

library(ShortRead) 
strm <- FastqStreamer("./my.fastq.gz") 
repeat { 
     fq <- yield(strm) 
     if (length(fq) == 0) 
    break 
     #do things 
     writeFasta(fq, 'output.fq', mode="a") 
     } 

を行うことができます読み込みます

答えて

0

通常、両端末尾のfastqファイルが注文されます。

したがって、削除された行を追跡してペアファイルから削除することができます。しかし、これは素晴らしい方法ではありません、あなたのデータがラインラップされている場合、あなたは痛みを感じます。

より良い方法は、ヘッダー情報を使用することです。

ヘッダペアは、2つのファイルに読み込むためには、ファイル1から...続きを読むリバースまたはフォワード(1または2)であるかどうかを指定するフィールドを除いて、

最初の読み取り同じです。 @ M02621:7:000000000-ARATH:1:1101:15643:1043 1:N:0:12

ファイルから

第一リード2 M02621 @:7:1101:15643:000000000-ARATH:1 1043 2: N:0:12

数字1101:15643:1043は、それぞれそのタイルのタイルおよびx、y座標を表します。

これらの番号は、特定の実行について、各読み取りペアを一意に識別します。 この情報を使用して、最初のファイルにない場合は、2番目のファイルから読み込みを削除できます。あなたはトリミング品質を行っている場合

また、... ...

Trimmomaticはペアエンドデータに品質/長フィルタリングを行うことができ、それが高速です
関連する問題