私はLaTeXをクラッシュさせるいくつかのユニコード文字を含む大きなテキストファイルを持っています。 LinuxのbashでsedなどのファイルでASCII以外の文字を見つけるにはどうすればいいですか?bashツールで非ASCII文字を検索するには?
答えて
は試してみてください。のように使用することができる
nonascii() { LANG=C grep --color=always '[^ -~]\+'; }
:[]
^
内
printf 'ŨTF8\n' | nonascii
が "ない" を意味します。したがって、[^ -~]
は、スペースと〜の間にない文字を意味します。したがって、制御文字を除いて、これは非ASCII文字と一致し、より移植性がありますが、以下の[^\x00-\x7f]
というわずかに精度の低いバージョンです。 \+
は1 or more
を意味し、各バイトに散在するのではなく、完全な文字の周りに色が表示され、マルチバイトシーケンスが破損する可能性があります。
うわー、これは素敵な赤色でも機能します。 –
あなたは '[^ - 〜] \ +'の意味を教えていただけますか? ^はafaikの始まりです。 –
非常に良い。しかし、制御文字(改行を除く)は見つかっていますが、実際はASCIIです。だから、タブ、キャリッジリターン(dosファイル)があるとき、それが見つけられる。非ASCII文字のみを出力する代替手段を提供できますか?他の答えの '[^ \ x00- \ x7f]アプローチは私にとってはうまくいきません。 – nealmcb
- 1. Bash/Linux .txtファイル内の非ASCII文字を検索し、ASCII文字で置き換えます。
- 2. 非ASCII文字を含むPythonモジュールを検索する
- 3. 非ASCII文字を検索するループファイル拡張子 - Python
- 4. Djangoのicontainsクエリで非ASCII文字を含むテキストを検索するには?
- 5. 文字列内の非ASCII文字を検出する
- 6. QuartzPDFを使用して非ASCII文字(キリル文字)をPDFで検索する方法は?
- 7. wxStyledTextCtrl非ASCII文字
- 8. ハッシュ非ASCII文字をC#
- 9. Bashの検索と置換文字列
- 10. fopen非ascii文字エラー
- 11. URLの非ASCII文字
- 12. Cの非ASCII文字
- 13. Ren'Py関数で非ASCII文字を使用するには
- 14. 非ASCII文字をホスト名で
- 15. scanf( "%s")に非ASCII文字を入力
- 16. ブタのラテン文字列の非ASCII文字を削除する
- 17. Pythonのreportlabで非ASCII文字をpdfに挿入する
- 18. 検索のUIDでExchange 2010が異常に動作する検索文字列US-ASCIIから
- 19. パラメータbashの文字列を検索して置換する
- 20. Sqliteをデータベース非ASCII文字のエラー
- 21. elasticsearchで絵文字/絵文字を検索するには?
- 22. 別の文字列で文字列を検索するには?
- 23. 1文字で文字列を検索するには?
- 24. 大文字と小文字を区別しないasciiサブ文字列を効率的に検索
- 25. 非ASCII文字でPythonでファイルI/Oを実行する
- 26. mysqlの全文検索で特殊文字を検索する
- 27. Python 2/3 subprocess.Popenと非ASCII文字
- 28. Python 2.7 - Elasticsearch - SyntaxError:非ASCII文字 '\ xc3'
- 29. Vimの:getlineのと非ASCII文字
- 30. Python Djangoエンコーディングエラー、 '\ xe5'非ASCII文字
UTF-8のファイルですか?文字はASCIIですが、いくつかは整形式のマルチバイトUTF-8であり、一部は(マルチバイトの)UTF-8で壊れていますか?整形式(マルチバイト)のUTF-8文字は多数ありますか?それとも他のエンコーディングですか? –