私は、セレンを使ってさまざまなツイッターアカウントからツイートを収集するhadoopを使ってプロジェクトを行っています。もう1つずつ行うのではなく、収集時間を短縮するためにhadoopを使用して同時に処理したいと思います。これは聞こえますか、それはハープの良い使い方でしょうか?MapReduceジョブのセレンをHadoopに使用していますか?
0
A
答えて
0
ツイートのストリームを一定にしてHDFSにロードしたり、ハイブ、ストーム、スパークのいずれかの処理フレームワークを使用してそれらのツイートを理解するためのストリーミングAPIがあります。ツイッターAPIを使用してコードを作成したくない場合は、パッケージ化されたツールが利用できます。Apache NiFiやFlumeを使用してツイートを作成し、HDFSにロードできます。
https://nifi.apache.org/docs/nifi-docs/components/org.apache.nifi.processors.twitter.GetTwitter/
http://blog.cloudera.com/blog/2012/09/analyzing-twitter-data-with-hadoop/
関連する問題
- 1. 複数のMapReduceジョブをhadoopで実行しています
- 2. のHadoopのMapReduceは、今私はのHadoopのMapReduceジョブを実行
- 3. Hadoop MapReduceジョブのデータローカリティをオフにする
- 4. hadoop mapreduceジョブの入力用gzファイルについて
- 5. 最高頻度のHadoop MapReduceジョブ
- 6. のHadoopのMapReduce: 私のコードマップクラス::MapReduceのジョブ内マッパーをチェーン用のドライバ
- 7. mapreduceジョブをhadoopソースコードのデータセットにどのクラスで接続しますか?
- 8. Hadoop MapReduce用クラスタシミュレータ
- 9. Apache Ignite HadoopアクセラレータMapReduceジョブがJobHistoryサーバーにありません
- 10. mapreduceジョブのチェーン内の2番目のジョブがHadoopで終了していません
- 11. は、HadoopでMapReduceジョブを実行できません。
- 12. Mapreduceを使用してhadoopのAvrofileへのテキストファイル
- 13. Hadoop MapReduce
- 14. のHadoop:私はJavaで3つのファイルを作っているのMapReduceジョブ
- 15. Hadoop 1.xのMapReduceについて
- 16. Hadoop MapReduceを使用してaws s3からHDFSにデータをインポートする方法
- 17. mapreduceジョブ/ hadoop出力ファイルを表示する方法
- 18. Hadoopでディレクトリを作成して読み込む方法 - Mapreduceジョブの作業ディレクトリ
- 19. jsp servletからmapreduceジョブを実行しています
- 20. Hadoop/MapreduceジョブのマッパークラスにあるSPARQLRepository unsing openrdf(sesame)に接続できません
- 21. HBaseからのHadoop mapreduceストリーミング
- 22. Hadoop MapReduce ClassNotFoundExceptionエラー
- 23. hadoop mapreduce teragen FAIL_CONTAINER_CLEANUP
- 24. Hadoop mapreduceプログラミング
- 25. Hadoop Oozie MapReduceアクションカスタムパーティショナー
- 26. のHadoopのMapReduceエラー
- 27. hadoopクラスタでmapreduce javaプログラムを実行しています
- 28. hadoopとmapreduceでRスクリプトを実行しています
- 29. MapReduceを使用せずにJavaでHadoopファイルにアクセスできますか?
- 30. Hadoop Mapreduceを使用した2つのExcelファイルの比較