エンコードされた文字列に使用されるエンコーディングのタイプを知ることができるのだろうか?少なくとも、特定のエンティティまたは単語がpython3.xの文字列かバイトであるかを調べる。 ありがとうございます。エンコードのタイプを見つける
0
A
答えて
3
chardetは、それがどのエンコードであるかを推測させます。しかし、これは短いテキストでは信頼性が高くありませんが、長いテキストではうまくいきます。
8
chardet
ライブラリをお勧めします。それはsome work from Mozillaに基づいており、あなたの必要性を満たすと思われます。
>>> import urllib
>>> rawdata = urllib.urlopen('http://yahoo.co.jp/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'encoding': 'EUC-JP', 'confidence': 0.99}
そして、そこだけでなく、そのページに覆われている、より複雑なユースケースがありますが、コアであなたは、単に文字列を渡すと、それは潜在的なエンコーディングのセットを返すことができますその推測に彼らの信頼と一緒に。
isinstance(x, bytes)
対
isinstance(x, str)
をあなたはダニエルが彼の答えの使用に言ったように、それは、あなたができるバイト、であると判断したら:それは文字列だか、バイトは簡単ですかどうかを確認するには
関連する問題
- 1. オブジェクトグラフ内の特定のタイプのオブジェクトを見つける
- 2. ゴランの基本タイプのカスタムタイプを見つける
- 3. 以前のバージョンのNPM @タイプを見つけるには
- 4. 特定のタイプの子供を見つける
- 5. アンドロイド:タイプ別のビューをどのように見つけるか
- 6. コントロールチェーン全体のタイプのコントロールを見つけるには?
- 7. Railsヘルパーから現在のレンダーMIMEタイプを見つける
- 8. ARM v7でデータのタイプを見つける方法は?
- 9. PHPでリモート/外部ファイルのMIMEタイプを見つける
- 10. 値セット間で共有タイプを見つける
- 11. タイプ別に子コンポーネントを見つけるには
- 12. wix light.exeが ''タイプのファイルを見つけられません
- 13. を見つける
- 14. 新しいタイプのファイルを見つけるためにスクリプトを更新する
- 15. 変数を反復して特定のタイプのインスタンスを見つける方法
- 16. app/Mage.php行のどのタイプのエラーを見つけるか。マゼンタで546 1.9?
- 17. すべての親タイプを見つける(基本クラスとインターフェースの両方)
- 18. 拡張子のない画像のMIMEタイプを見つける方法は?
- 19. ファイルの内容からMIMEタイプを見つけるためのJavaライブラリ
- 20. hpricot:タイプBまたはCの祖先を持たないタイプAの要素を見つける
- 21. ミュールデータベースコネクタ - タイプのマッピングを見つけることができません:CURSOR
- 22. テンプレートコントロールの親をタイプ(!)(wpf)で見つけることができません
- 23. ルビー/見つける
- 24. 「見つける-ls」
- 25. PouchDB見つける
- 26. 見つける顔
- 27. 404エラーページを見つける
- 28. excelマクロを見つける
- 29. linux:ポストグルアイドルプロセスオリジネーターを見つける
- 30. ビデオカードを見つける
このテストが動作するようになって、私は次のように動作しないことを示していると考えているかわからない: >>>タイプ(x)の >>>でisinstance(X、バイト) 真 >> > isinstance(x、str) True –
kasterma
@kasterma:これは、Python 2ではstrとbytesが同じ型であるからです。これはPython 3では当てはまりません。 –