0
hadoopでデータパイプラインを作成する必要があります。私は、データのインポート、エクスポート、データを整理するためのスクリプトを用意しており、これをパイプラインで設定する必要があります。データパイプラインを作成するためのさまざまなツール
私はOozieをデータのインポートとエクスポートのスケジュールに使用していましたが、データクリーニングプロセスのためにRスクリプトを統合する必要があります。
私はファルコンが同じもののために使用されるのを見ます。
- falcon in clouderaのインストール方法を教えてください。
- hadoopでデータパイプラインを作成するための他のツールはありますか?
oozieのシェル・アクションからRを呼び出すことができます。 – abhiieor
コードをあなたが必要な場合は、 'エクスポートエンジン= $ 1 輸出hive_db = $ 2 輸出RCODE = NeighborGroupingState.R Rscript --vanilla $ {RCODE} $ 1 $ 2 --hiveconf tez.credentials.path = $ {} HADOOP_TOKEN_FILE_LOCATION --hiveconf mapreduce.job.credentials.binary = $ {HADOOP_TOKEN_FILE_LOCATION} ' – abhiieor