誰かがAWKの問題を助けてくれますか? 私は以下のような大きなGTFファイルを持っています。第9フィールドには、使用したいgene_idが含まれています。別のファイルに基づいてtxt(GTF)ファイルをフィルタリングする
file1.gtf
chr1 hg38_refGene exon 67127166 67127257 0.000000 - . gene_id "NR_075077"; transcript_id "NR_075077";
chr1 hg38_refGene exon 67131142 67131227 0.000000 - . gene_id "NR_075077"; transcript_id "NR_075077";
chr1 hg38_refGene exon 67134930 67134971 0.000000 - . gene_id "NR_075077"; transcript_id "NR_075077";
chr1 hg38_refGene start_codon 201283703 201283705 0.000000 + . gene_id "NM_000299"; transcript_id "NM_000299";
chr1 hg38_refGene CDS 201283703 201283904 0.000000 + 0 gene_id "NM_000299"; transcript_id "NM_000299";
chr1 hg38_refGene exon 201283452 201283904 0.000000 + . gene_id "NM_000299"; transcript_id "NM_000299";
私はその後、私は残りの部分からフィルタリングしたいすべてのgene_idを持つ別のファイルを持っています。
NM_000017
NM_000019
NM_000024
NM_000033
NM_000034
FILE2.TXT
私は維持したいgene_idと行のフィルタリングfile1のように置くアウトをしたいと思います。 Pythonの他のソリューションも高く評価されます。 ありがとうございます!
最終結果を – RomanPerekhrest
に投稿し、これまでに試したことがあります。 –