Django ORMラッパーを使用して、テキストをデータベースに保存します。問題は、このテキストが外部のウェブサイトを掻き集めることによって生成され、何度も間違ったエンコードでリストされているように見えることです。生のバイトを保存したいので、スクラップをやり直すことなく時間が経つにつれてエンコード検出を向上させることができます。しかし、Djangoはすべてがユニコードとして保存されるように思えます。どういうわけか、その周りを回ることはできますか?Djangoで未知のエンコーディングのUnicodeを扱うには?
1
A
答えて
1
例えば、base64にエンコードされたデータを保存することができます。または、ブラウザからHTTPヘッダーを分析しようとすると、そこから適切なエンコードを取得する方が簡単かもしれません。
1
データを含むファイルを作成します。ファイルへの参照を保持するには、Django models.FileField
を使用します。
いいえ、大量のI/Oは必要ありません。ファイルが小さければ、2または3のI/Oが追加されます(ディレクトリの読み取り、iノードの読み取り、およびデータの読み取り)。
関連する問題
- 1. 未知のPDFエンコーディング
- 2. imagickで未知の画像を扱う
- 3. Tensorflowで未知の次元を扱う
- 4. 「未知のエンコーディング名」Railsの
- 5. Python未知のエンコーディングutf8
- 6. Python3.4 + Django + Ubuntu: 不明なエンコーディング:raw-unicode-escape
- 7. はDjangoのUnicodeエンコーディングから文字列を抽出
- 8. Python IOモジュールの未知のエンコーディングunittesting GAE
- 9. Pythonの:LookupErrorが:未知のエンコーディング:CP0
- 10. 電子メールでのUnicodeエンコーディング
- 11. アクセント付きPHP未知のエンコーディング
- 12. 未知のジェネリック型を扱う方法はありますか?
- 13. Objective-Cメッセージング、未知のメッセージをスマートに扱う
- 14. Javaサーブレット:未知のエンコーディングを処理するには?
- 15. Django 1.4未知のコマンド: 'runserver'
- 16. PythonからMongoDBへの未知のエンコーディングでファイルをインポートする
- 17. Struts2バージョン2.0.x未知のアクションを扱う
- 18. 未知の文字列をUnicodeに変換する - Python
- 19. TransifexでDjangoテンプレートを扱うには?
- 20. Djangoで日付を扱うには?
- 21. Djangoは未知の移行と "notmigrations"ディレクトリ
- 22. 未知のエンコーディングをutf-8に変換します。
- 23. 私のポストフィックスログで未知のアドレスを扱うにはどうすればいいですか?
- 24. C++でのUnicode文字の扱い
- 25. DjangoメッセージフレームワークのUnicode
- 26. ASCIIをUnicodeエンコーディングに変換する
- 27. XML Unicode安全なエンコーディング
- 28. PythonでUnicode(非ASCII)文字を扱う方法は?
- 29. Pythonでhttp User-agentのUnicode文字を扱う
- 30. Djangoの残りのフレームワークでImageFiledを扱うには?
一部のサイトでは、データが誤ってエンコードされるか、ページ全体でエンコードが矛盾します。私は元のデータを保存したいと思っています。しかし、私は戻って正確にそれを見ることができます。 – lacker