0
hadoopを使用してghtorrent APIによって提供されるGitHubデータを照会しようとしています。このように多くのデータ(4〜5 TB)をHDFSに注入するにはどうすればよいですか?また、そのデータベースはリアルタイムです。ブタ、ハイブ、hbaseなどのツールを使用してハープープのリアルタイムデータを処理することは可能ですか?Hadoopを使用してgithubデータを照会
hadoopを使用してghtorrent APIによって提供されるGitHubデータを照会しようとしています。このように多くのデータ(4〜5 TB)をHDFSに注入するにはどうすればよいですか?また、そのデータベースはリアルタイムです。ブタ、ハイブ、hbaseなどのツールを使用してハープープのリアルタイムデータを処理することは可能ですか?Hadoopを使用してgithubデータを照会