私は、膨大な量のTwitterデータを掻き集める必要があるpythonでプロジェクトを構築しています。 100万人のユーザーとそのすべてのつぶやきのようなものは削り取る必要があります。つぶやきの巨大な量を掻く方法
私はTweepyとTwythonを使用していましたが、Twitterの制限が非常に速かったです。
センチメント分析企業などは、どのようにデータを取得しますか?どのようにそれらのつぶやきを得るのですか?あなたはこれをどこか購入したり、異なるプロキシーや何かを繰り返すものを作りますか?
例えば、TrstランクのInfochimpsのような企業は、どのようにデータを取得しますか? * http://www.infochimps.com/datasets/twitter-census-trst-rank
限界に達するには時間がかかり過ぎると、数日間に作業を分散し、データベースをよりゆっくりと構築する必要があります。私はそれが企業がこれをやる方法だと思う。 – heltonbiker