Bigデータが初めてです。 HDFSは構造化されたデータをより多く格納するためのものであり、HBaseは構造化されていないデータを格納するためのものであることを知りました。データを取得してデータウェアハウス(HDFS/HBase)にロードする必要があるREST APIがあります。データはJSON形式です。だから、データをロードする方が良いでしょうか? HDFSまたはHBase?また、これを行うためのチュートリアルを私に指示してください。私はこれについて、Tutorial with Streaming Dataについて調べました。しかし、これが私のユースケースに合うかどうかはわかりません。REST APIからデータを取得し、HDFS/HBaseに保存します。
この問題を解決するために私が特定のリソース/テクノロジに導くことができれば、大きな助けになります。