2016-06-23 10 views
1

圧縮ファイル(FASTA bz2など)から読み込むことはできますか?私は通常skbio.sequence.Sequence.readを使用しますが、このオプションは表示されません。skbioを使用して圧縮FASTA bz2ファイルから読み取る

ありがとうございます!

+0

SeqIO.parse(in_f、 "fasta")のsのために、in_f:としてbz2.BZ2File(fna_bz2、 "r")を使って、SeqIO.parseのskbioの代替を探しています:)ありがとうございます! –

答えて

2

これは、次のように行うことが可能です:

import skbio 
seq = skbio.io.read("seqs.fna.bz2", format='fasta', compression='bz2', into=skbio.DNA) 

私はscikitバイオ0.5.0を使用していますが、これは同様に、以前のバージョンで可能でなければなりません。私は明示的に圧縮タイプを定義していますが、一般的には必要ありません。

関連ドキュメントはherehereです。

+1

注意すべき事項:1)上記の例では手続き型APIを使用しています。オブジェクト指向APIを等価的に使用して、これを行うことができます(例: 'skbio.Sequence.read(" seqs.fna.bz2 ")'。 2)scikit-bioは、使用されるファイル拡張子にかかわらず、圧縮タイプとファイルフォーマットを推測しようとします。 – jairideout

+0

ファイル内の複数のエントリでどのように動作するのですか? –

関連する問題