2013-03-23 11 views
8

感想分析のためにツイートのコーパスを編集しており、Apple Emojiの文字でツイートを取得しようとしています。ユニコード文字/ Apple絵文字でツイートを検索していますか?

私はのように顔のいずれかのUnicode文字を発見した

:F0 9F 98 84

これまでのところ、私はできなかった:UTF-8、U + 1F604(U + D83D U + DE04)意味のある結果を得る。私が\ud83d\ude04を検索した場合、いくつかのツイートが戻ってきますが、何も役に立ちません。 \U0001f604は検索時に何も返しません。

Twitterでこれらの文字を検索する方法はありますか?

私はAPIのpython-twitterラッパーを使用していますが、より良い選択肢があれば何か他のものを使っても構わないと思います。

+0

http://www.iemoji.com/には絵文字を含むつぶやきがあり、賞金をあげているので、これは可能です。 –

答えて

3

これは可能である - しかし、それは少しトリッキーです....

あなたは、標準のTwitter検索を使用することはできません - しかし、あなたはストリーミング検索を使用することができます。

RubyとNodeのhttps://github.com/mroth/emojitrack-feederにはオープンソースライブラリがあります。

5

@Therence Edenが指摘するように、REST検索APIのtwittersはemoji文字では機能しませんが、ストリーミングAPIは(2016年1月現在)動作します。

Pythonでtwitters APIにアクセスするためのいくつかのツールがあります。私が主に使ったのはtweepyです。 pipと一緒にインストールできます。

tweepy docs on setting up the streaming apiは非常に簡単です。フィルタする文字列には、実際の絵文字が含まれている必要があります(例: '')。

これは、emojisを「単語」として検索します。つまり、空白で囲まれています。 "無料"のようなものは見つからないでしょう!

+0

非常に奇妙です。私は自分自身に気づいた。ストリーミングがそれを行うことができますが、検索しない理由は何ですか?とにかく、この回答はOPによって受け入れられているはずです。 – sudo

関連する問題