2010-12-04 8 views
0

私のアプリケーションは、Twitter検索APIからJSONを消費しています。しかし、私はコンテンツをどのように処理すべきかについて混乱しています。それぞれのTweet JSONオブジェクトは "text"プロパティを持っているので、そのように扱われるべきだと私は想定していました。しかし、私は多くの",&amp、および他のナンセンスの内容を見ています。Twitter Search API:TweetテキストにはXMLまたはHTMLが含まれていますか?

Twitter APIはちょっと悪いですし、XMLを使ってテキストコンテンツを誤ってエンコードしていますか、Twitter APIのコンシューマーはTweetテキストを平文以外のものとして処理するはずですか?他のTwitterユーザーとの通信を示す@usernameやリンクを示すhttp://などのマークアップ規則があることを認識しています。 XMLやHTMLのエンタテイも期待していますか?明らかに、私は盲目的にTweetテキストをHTMLとして挿入したくありません。

答えて

0

テキストフィールドにはxmlではなくhtmlでもテキストが返されますが、テキストには特殊なhtml文字が使用されます。" tjatは引用符です(混乱させずにjsonに含めることはできません) "2011 \ u5e746 \ u6708 \ u767a \ u"のような外国語の特殊文字なので、この事を見つけるのに驚かないでください。最も一般的なマーキーを知るだけで、テキストで何かしたいときに置き換えることができます。

+0

ご回答ありがとうございます。彼らの特別なエンコーディングがどこに文書化されているか知っていますか?これはJSON標準の一部なので、 '\ u #### 'のものが期待できますが、私が探している特定のHTMLエンティティがわかりません(二重引用符は、 '&'がエスケープされる必要がある理由はありません)。 – Jacob

関連する問題