2017-02-10 6 views

答えて

2

あなたは原住民を処理するためティカを使用ElasticSearchプラグイン "インジェスト添付ファイル" を、使用することができますどうもありがとうございました:

https://www.elastic.co/guide/en/elasticsearch/plugins/master/ingest-attachment.html

「インジェストアタッチメント」プラグインは、以前は「マッパー・添付ファイル」プラグインを、命名されますので、古い名前からキーワードでヘルプを見つけることがあります。

https://www.elastic.co/guide/en/elasticsearch/plugins/current/mapper-attachments.html

これらのプラグインは、あなたが直接ElasticSearchにPST base64エンコードを渡すことができ、およびESが自動的にシーンの背後にあるデータを解析し、インデックスされます。

あなたが何かのカスタムをしたい場合は、私はPSTファイルを読み、多くのgithubのプロジェクトの一つを使用することをお勧めして、好きな文書マッピングでElasticSearchにデータを送信します。多くのgithub PSTリーダープロジェクトがあるので、あなたが最も快適な言語(java、C#など)のために人気のあるものを選んでください。代わりに、PSTリーダーライブラリーのlibpst、あなたはまた、Apacheのティカのためのカスタムパーサーを書くことができ

PSTリーダー、および使用:githubのは、検索用語を提案しました。それを使用する方法のマニュアルは、ここで見つけることができます:この記事ショーなどのPUTコールに結果encodedfile文字列を渡し

FileInputStream fileInputStreamReader = new FileInputStream(file); 
byte[] bytes = new byte[(int)file.length()]; 
fileInputStreamReader.read(bytes); 
String encodedfile = Base64.encodeBase64(bytes).toString(); 

:BASE64へ

https://tika.apache.org/1.6/parser.html

Javaの例は、文字列にファイルをエンコード:

https://www.elastic.co/guide/en/elasticsearch/plugins/current/using-ingest-attachment.html

+0

は、私はいくつかの質問を持っているあなたの愛する@erikに感謝: 私はどのようにかどうかを確認することができます私のファイルはbase64ですか? このプラグインを使用する方法は?今はインストールしましたが、使用方法はわかりません。私は弾力性がとても新しいです。私はjsonファイルを読み込んで、弾力的にそれを問い合わせることができましたが、pstファイルのこのアクションの仕方はわかりません。 Javaで –

+0

Base64でエンコードするファイルはここで見つけることができます。https::http://stackoverflow.com/questions/13109588/base64-encoding-in-javaここでは、インジェストプラグインへのPUT呼び出しでデータをロードするには、いくつかの例がある// WWW .elastic.co /ガイド/ EN/elasticsearch /プラグイン/マスター/使用-取り込み-attachment.html – Erik

+0

エリック私は間違いがあると思います。私はファイルをエンコードしたくないのですが、base64であるかどうかを確認したいだけです。 は、第2のリンク私はすでに、それはファイルからインデックスへの負荷情報をカバーしていないこと、しかし読み、 –

関連する問題