圧縮ファイル(FASTA bz2など)から読み込むことはできますか?私は通常skbio.sequence.Sequence.readを使用しますが、このオプションは表示されません。skbioを使用して圧縮FASTA bz2ファイルから読み取る
ありがとうございます!
圧縮ファイル(FASTA bz2など)から読み込むことはできますか?私は通常skbio.sequence.Sequence.readを使用しますが、このオプションは表示されません。skbioを使用して圧縮FASTA bz2ファイルから読み取る
ありがとうございます!
これは、次のように行うことが可能です:
import skbio
seq = skbio.io.read("seqs.fna.bz2", format='fasta', compression='bz2', into=skbio.DNA)
私はscikitバイオ0.5.0を使用していますが、これは同様に、以前のバージョンで可能でなければなりません。私は明示的に圧縮タイプを定義していますが、一般的には必要ありません。
注意すべき事項:1)上記の例では手続き型APIを使用しています。オブジェクト指向APIを等価的に使用して、これを行うことができます(例: 'skbio.Sequence.read(" seqs.fna.bz2 ")'。 2)scikit-bioは、使用されるファイル拡張子にかかわらず、圧縮タイプとファイルフォーマットを推測しようとします。 – jairideout
ファイル内の複数のエントリでどのように動作するのですか? –
SeqIO.parse(in_f、 "fasta")のsのために、in_f:としてbz2.BZ2File(fna_bz2、 "r")を使って、SeqIO.parseのskbioの代替を探しています:)ありがとうございます! –