"tweets"というデータベーステーブルがあります。 Twitter Search APIを使用してツイートをダウンロードしました。データベーステーブルの照合順序は、MySQLがアドバイスしたlatin1_swedish_ciに設定されています。これは、少なくともEnlish言語を保持しているためです(MySQLサポートページのどこかでこれを読んでいます)。とにかくMySQLデータベースのスクランブルテキスト
、私は今、つぶやきの多くはこのように見える参照してください。
$S&P news: Bank of America’s Mortgage-Bond Accord http://bit.ly/oTXC5a
@LucciAlerts >> $BAC from a pincher play setup
미êµì‹ 용등급ì´ë–¨ì–´ì¡Œë„¤ RT @CNBC RT @alexcrippen: S&P affirms AA+
- 私は&を信じて、好きで、元の文字にそれらを変換するために(PHP)htmlspecialchars_decode()を使用して固定することができます。
- しかし、私は "Americaâ’s"を修正する方法を知らない。明らかに、アポストフェア( ')にする必要がありますが、どうすれば元に戻すことができますか?
- 最後に、すべての種類のASCII文字をつぶやき(星座、顔文字の代わりに「本当の」笑顔)したい人もいます。それらは上記のように "미êμì<ìš©ë"±ê¸‰‰ ' - ¨ " - "¡Œë "¤"として保存されています。これを修正する方法はありますか?もしそうなら、方法はありますか?
ご協力いただきありがとうございます。
latin1_swedish_ciからutf8へのクイックスイッチを推奨 –
文字セットをutf8に設定してもう一度やり直してください。 – Leigh
たとえば、https://api.twitter.com/1/statuses/show.json?id=38041113268854784を参照してください。 APIによって指定されたTweetのテキストコンテンツ( "text")は次のとおりです: "$ \ u00aa \ u00aa \ u264f \ u00aa \ u00aa \ $ \ u00aa \ u00aa \ u264f \ u00aa \ u00aa RT nadiaberod:makasih(\ u007B \ u007D)RT Lsa_fabulous:ThRT nadiaberod:anind_aurelly Lsa_fabulous denyciouss @nuruuuuuuul ?? "。どのように元の文字を取得しますか? utf8_decode()を通すことはできません; t help ... – Pr0no