データを処理しようとしましたが、私の問題の解決策が見つけられません。小文字が30%を超える行を削除する
>ram
cacacacacacacacacatatacacatacacatacacacacacacacacacacacacaca
cacacacacacacaca
>pam
GAATGTCAAAAAAAAAAAAAAAAActctctct
>sam
AATTGGCCAATTGGCAATTCCGGAATTCaattggccaattccggaattccaattccgg
and many lines more....
私はすべての行と対応するヘッダをフィルタリングしたい(ヘッダーが>で始まる)は、配列文字列(これらは>で始まらない)が30以上のパーセントを含むている:私はのように見えるファイルを持っています小文字。シーケンス文字列は複数の行にまたがることができます。私は、入力ファイルを読み込み、その後のawk、grepを扱うためのsedのwhileループのいくつかの組み合わせを試してみましたが、何も良い結果はありませんでした
>pam
GAATGTCAAAAAAAAAAAAAAAAActctctct
:
だからコマンドの後のような出力が見えるはずですxyが。
あなたは試行して失敗しましたか?あなたの努力を示してください。 – Inian
また、 'bash'は計算にも浮動小数点の値も評価できないので、これには適しません。あなたは 'bash'タグを削除することができます – Inian