2017-04-26 8 views
0

私は、2つのabinitioツールの予測されたタンパク質を含むmultifastaファイルを持っています。すべてのシーケンスには、最後に立体(*)が含まれています。私はファイルから削除したい。私のシーケンスは、このようなものです:マルチファラファイルのfasta配列の末端から立体構造(*)を取り除く

>snapgene1 
SFLPSAEAIEKVLSHMSRRIIDDMKAELQQPEMRWFWP* 
>snapgene2 
SFLPSAEAIEKVLSHIIIIAAAAKKKPPFFDDMKAELQQPEMRWFWP* 

私はこの様配列たい:

>snapgen1 
SFLPSAEAIEKVLSHMSRRIIDDMKAELQQPEMRWFWP 
>snapgene2 
SFLPSAEAIEKVLSHIIIIAAAAKKKPPFFDDMKAELQQPEMRWFWP 

は、誰もがこの中で私を助けることができます。ありがとう

答えて

1

テキストファイル "TEMP.TXT" に保存されている場合は、このコマンドを使用することができます。awkでは

sed -i "s/*$//" temp.txt 
+0

それは働いた。どうもありがとう –

0

、あなたがfileであなたのfastasを続ける場合:

$ awk '{sub(/\*$/,"")}1' file 
>snapgene1 
SFLPSAEAIEKVLSHMSRRIIDDMKAELQQPEMRWFWP 
>snapgene2 
SFLPSAEAIEKVLSHIIIIAAAAKKKPPFFDDMKAELQQPEMRWFWP 

それは置き換えられます末尾に*があります。

関連する問題