2016-08-07 5 views
2

私はこのような問題に直面しています。私はtweepyを使って+10000のつぶやきを集めました。私はnltkのnaive-bayes分類を使い、つぶやきを+5000にフィルターしました。 分類された5000のツイートからユーザーフレンドシップのグラフを生成したいと思います。問題は、私がtweepy.api.show_frienship()でチェックできることです。しかし、時間がかかりすぎて、終わりのない評価エラーで終了することがありました。Twitterの友情を確認する最も効率的な方法は? (5000以上のチェック)

友情をよりうまく確認できる方法はありますか?

答えて

0

私はTweepyの制限についてよく分かりませんが、urllibとBeautifulSoupを使っていつでも基本的なWebスクレーパーを書くことができます。

あなたがしようとしていることを達成するwww.doesfollow.comなどのウェブサイトを利用することができます。 (このページではリクエストの制限についてはわかりませんが、同じことをする他のウェブサイトが数多くあります)このウェブサイトは非常に簡単なので興味深いです。

たとえば、TwitterでGoogleとTwitterが「友人」であるかどうかを確認するには、リンクは単にwww.doesfollow.com/google/twitterです。あなたはちょうどそのような'www.doesfollow.com/'+ user1 + '/' + user2

としてURLにユーザーを追加することができますよう、あなたがユーザーによってdoesfollowの結果ページを実行するため

これは非常に簡単になるだろう、ユーザーがTwitterで友達である場合は、このタグがあります。

<div class="yup">yup</div>

と、このタグユーザーがTwitterで友人でない場合:

<div class="nope">nope</div>

したがって、ページソースコードを解析して検索して、それらのタグのどれが存在するのかを調べて、ユーザーがTwitter上で友人であるかどうかを判断できます。

これは、あなたが問題にアプローチしたかった方法ではないかもしれませんが、それは可能です。私はあなたの質問のグラフの部分にどのようにアプローチするかについては完全にはわかりません。私はそれを調べなければならないだろう。

+0

どのように私はこの(yup/nope)のデータをWebからPythonを使って得るのですか?そのウェブページdoesntはjsonを持っています... –

+0

@drizzersilverberg右クリックしてページを表示 – Harrison

関連する問題