1
FlumeソースをSpooldirタイプに設定しました。私は多くのCSVファイル、.xl3と.xlsを持っていて、私はFlumeエージェントがspooldirからHDFSシンクにすべてのファイルをロードするようにしたい。しかし水路エージェントリターン例外flume load csv filesはhdfs sinkよりも優れています
これは水路ソースのための私の設定です:
agent.sources.s1.type = spooldir
agent.sources.s1.spoolDir = /my-directory
agent.sources.s1.basenameHeader = true
agent.sources.batchSize = 10000
と私のHDFSは、シンクは:
agent.sinks.sk1.type = hdfs
agent.sinks.sk1.hdfs.path = hdfs://...:8020/user/importflume/%Y/%m/%d/%H
agent.sinks.sk1.hdfs.filePrefix = %{basename}
agent.sinks.sk1.hdfs.rollSize = 0
agent.sinks.sk1.hdfs.rollCount = 0
agent.sinks.sk1.hdfs.useLocalTimeStamp = true
agent.sinks.sk1.hdfs.batchsize = 10000
agent.sinks.sk1.hdfs.fileType = DataStream
agent.sinks.sk1.serializer = avro_event
agent.sinks.sk1.serializer.compressionCodec = snappy