2011-11-25 2 views
8

TwitterのストリーミングAPIの正式なエンコードは何ですか?私の見たことはUTF-8ですが、前提を避けたいと思います。Twitter Streaming APIで使用されている公式のエンコーディングですか?それはUTF-8ですか?

彼らも、彼らは彼らの公式のエンコーディングとして使用するもので、ヒントところ、私が見てきたTwitterのサイトの一部だけはここにある:

Twitterが我々がUTFを使用することをユーザーに不利に望んでいない

-8または問題のAPIクライアントが長い表現

https://dev.twitter.com/docs/counting-characters

を使用しているという事実のために誰もが答えるより多くの「公式」を持っていますか?私は特定の前提を作るストリーミングAPI用のステートマシントークナイザを書いています。私が最後に望むのは、UTF-16のようなものに遭遇することです。

ありがとうございます! :D

答えて

4

1つの指標は、Twitterが事実上すべてで使用するJSON formatがUTF-8を指示する(または少なくともデフォルトにする)ということです。彼らはもエンコードを示す適切なHTTPヘッダーを設定する必要があります(ただしこれは確認していません)。代わりにXMLを使用している場合、XMLの開始タグはエンコードを明示的に示します。これはUTF-8です。

0

もし彼らがUTF-8を使用していると言うなら、それはかなり良い賭けです。 UTF-8は非常に一般的であり、野生のUTF-16は私が見たものからかなりまれです。

さまざまな文字をサポートしているかどうかをテストすることで自分のことを証明しようと思えば、賢明なライブラリもあります。これらの中で最も優れたものは、ロードされているときにFirefoxがウェブページのエンコーディングを検出するために使用されます:http://www-archive.mozilla.org/projects/intl/UniversalCharsetDetection.html

関連する問題