URLからxmlファイルをダウンロードするためにLinux curlを使用しようとしています。linux curl save as utf-8
XMLはUTF-8でエンコードされていることをかなり確信して、
疑ってカール-o doesntがUTF-8として保存します。
強制的にUTF-8にカールで保存する必要はありますか?
XMLフィードは動的であるため、ではない、それは任意のUTF-8文字を含むすべての時間:私が見つけたものを提案のための
おかげで、。 xmlエンコーディングとヘッダーのコンテンツタイプでutf-8として設定されているにもかかわらず、コンテンツ全体にutf-8文字がないことがあります。charset = utf-8。少なくともutf-8文字が含まれている場合、utf-8として保存されます。
この場合、curlはutf-8としてダウンロードされません。これはutf-8文字がないため意味がありますが、utf-8として保存する必要があるのはなぜですか。
これはちょっと難しいですが、いくつかのバリデーターはutf-8に対して有効でなければならないので、デフォルトではすべてのxmlがutf8エンコーディングであるためutf8に強制する解決策が必要です。
iconv f iso8859-1 utf-8 iso8859-1にないと疑われているので、このケースではうまく動作しませんでした。
さらに優れた解決策が必要です。
私はcurl'はそれがフェッチ内容に一切変更を行い、そして、それは確かに再エンコードしないテキスト '信じていません。 – geoffspear
こんにちは、ありがとう...しかし、私はなぜ、それはあなたがutf - 8として保存していないのだろうかと思って再エンコードデータを探していないよutf-8 – flyclassic
あなたはutf-8として保存していないと思いますか?あなたは実際に何を達成しようとしていますか? – geoffspear