2017-08-19 24 views
0

ソースがHDFS &の宛先をOracle DBとして持つETLプロセスにApache NIFIを使用すると効果的です。Apache NIFI for ETL

+0

有効性を評価する方法は?それは要件をカバーしていますか? oracleとhdfsコネクタ - 'yes'。それは拡張可能ですか? - 'yes' - groovy/js/pythonを使ったスクリプトやカスタムプロセッサの構築。すべての制限事項を列挙しますか? - 私にとって、あなたが期待している機能を厳密な回答リストに載せること。IHMO:ETLのようなタスクのためのツールとしてnifiを選択します。 – daggett

答えて

0

haddopとoracleの間の媒体としてApache NIFIを使用すると、nifiはHadoop環境とOracle DB間の応答時間に依存します。このsqoopは正しいコンポーネントです。この大規模なvoulumesにnifiを使用してHDFSとOracleとの間でデータを転送しています。私はボトルネックだけがメモリすなわちRAMであることがわかります。 NIFIは純粋にJava上で動作し、それは吸うかもしれませんし、また、sqoopのような並列処理の概念を利用しないかもしれません。 nifiプロセッサは実行時にデータを処理するためのJavaスレッドであり、データのストリーミングにはnifi適合です。