問題を扱っています。私はデータ化を&予測インフラストラクチャにしたいと考えています。大きなデータアーキテクチャー:Elivesearch-Kibana with HiveまたはHadoop
私はHdfs(ES-Hadoop付き)、& Hdfs上のSpark(Python)をモデル化すると考えました。
私の質問は、HdfsのデータをESで正しくインデックスできますか、Elasticsearch & Hdfsの間でHiveまたはSparkを使うべきですか?
どのアーキテクチャが最適な方法かわかりません。
私の質問が明白であったかどうかわかりません...つまり、HDFSのデータを直接索引付けするのは良いですか? –