2016-05-02 18 views
-1

開始文字列以外の行全体を削除します。私のファイルには、次のようになります?sedコマンドを使用して開始文字列以外の行を削除する

CAM_READ_0623233313/library_id = CAM_LIB_002149/sample_id = CAM_SMPL_003380 raw_id = G9ALM7U02GRHFF長= 72/IP_notice = CAMERAからダウンロードし、この遺伝情報は、デンマークの遺伝的遺産の一部であると考えることができます、サンプルが得られた国。この情報の利用者は、1)遺伝情報が提示されている国でデンマークを起源国と認定し、2)CBDウェブサイト(http://www.cbd.int/countries/)で特定されたCBDの焦点に連絡する商業目的。? AGGTAGTTTCCTCTACAGACTCTGCTATTTTCATCCGTGCGTCTTCGCGGCCGGTCCAGAGCGCGCCCCACG

私の最終的な出力は次のようになります。

CAM_READ_0623233313 AGGTAGTTTCCTCTACAGACTCTGCTATTTTCATCCGTGCGTCTTCGCGGCCGGTCCAGAGCGCGCCCCACG

私はsedコマンドでこれを行うことができますどのように? 間に改行はなく、形式は同じです。 私はすべての行を1つにマージしようとするたびに。

+0

これまでに何を試みましたか?あなたは尋ねる前に少しGoogleをやりましたか? – fedorqui

+0

入力文字列に改行があるかどうかは不明です。より正確になります。最初の 'space'と最後の'? 'の間で何かを取り除くことができるように見えます...入力文字列のどの部分が常に同じ形式であるかを言うなら、助けになります。 – basZero

+0

私はすべての行を必要な出力ではない1行にマージしようとするたびに。私は正規表現のマスターではないと言います。 – meenalm

答えて

0
$ cat data 
CAM_READ_0623233313 /library_id=CAM_LIB_002149 /sample_id=CAM_SMPL_003380 raw_id=G9ALM7U02GRHFF length=72 /IP_notice=?This genetic information downloaded from CAMERA may be considered to be part of the genetic patrimony of Denmark, the country from which the sample was obtained. Users of this information agree to: 1) acknowledge Denmark as the country of origin in any country where the genetic information is presented and 2) contact the CBD focal point identified on the CBD website (http://www.cbd.int/countries/) if they intend to use the genetic information for commercial purposes.? AGGTAGTTTCCTCTACAGACTCTGCTATTTTCATCCGTGCGTCTTCGCGGCCGGTCCAGAGCGCGCCCCACG 
$ sed -r 's/^(\w+).*\?(\s*\w+)$/\1\2/g' data 
CAM_READ_0623233313 AGGTAGTTTCCTCTACAGACTCTGCTATTTTCATCCGTGCGTCTTCGCGGCCGGTCCAGAGCGCGCCCCACG 
$ 
+0

私のデータでは機能しませんでした – meenalm

+0

@meenalmあなたの質問にあなたが提供したデータを使用しました。あなたはデータ全体を投稿できますか? – ritesht93

+0

私はファイルでインプレイスファイルの編集が必要です。ファイルのサイズが600MBのファイルサイズに繰り返されます – meenalm

0
awk '{print $1,$NF > (FILENAME) }' file 

最初と最後のフィールドを印刷します。

+1

ファイルのインプレース編集が必要です – meenalm

+0

@sjsam:改行はなく、パターンは600 MBのファイルサイズに繰り返されます。 – meenalm

+0

@meenalm。あなたはgnu-awkを使っていますか? – sjsam

関連する問題