私はelasticsaerchでjsonファイルを解析することができます。 とにかくMicrosoft OutlookのPSTファイルをElasticsearchインデックスに解析/インデックスするにはどうしますか? PSTファイルを解析してelasticsearchにインデックスする方法はありますか?
は(... PDF、XLS、PSTなど)答えて
あなたは原住民を処理するためティカを使用ElasticSearchプラグイン "インジェスト添付ファイル" を、使用することができますどうもありがとうございました:
https://www.elastic.co/guide/en/elasticsearch/plugins/master/ingest-attachment.html
「インジェストアタッチメント」プラグインは、以前は「マッパー・添付ファイル」プラグインを、命名されますので、古い名前からキーワードでヘルプを見つけることがあります。
https://www.elastic.co/guide/en/elasticsearch/plugins/current/mapper-attachments.html
これらのプラグインは、あなたが直接ElasticSearchにPST base64エンコードを渡すことができ、およびESが自動的にシーンの背後にあるデータを解析し、インデックスされます。
あなたが何かのカスタムをしたい場合は、私はPSTファイルを読み、多くのgithubのプロジェクトの一つを使用することをお勧めして、好きな文書マッピングでElasticSearchにデータを送信します。多くのgithub PSTリーダープロジェクトがあるので、あなたが最も快適な言語(java、C#など)のために人気のあるものを選んでください。代わりに、PSTリーダーライブラリーのlibpst、あなたはまた、Apacheのティカのためのカスタムパーサーを書くことができ
PSTリーダー、および使用:githubのは、検索用語を提案しました。それを使用する方法のマニュアルは、ここで見つけることができます:この記事ショーなどのPUTコールに結果encodedfile文字列を渡し
FileInputStream fileInputStreamReader = new FileInputStream(file);
byte[] bytes = new byte[(int)file.length()];
fileInputStreamReader.read(bytes);
String encodedfile = Base64.encodeBase64(bytes).toString();
:BASE64へ
https://tika.apache.org/1.6/parser.html
Javaの例は、文字列にファイルをエンコード:
https://www.elastic.co/guide/en/elasticsearch/plugins/current/using-ingest-attachment.html
- 1. Microsoft.SqlServer.Types.SqlGeometryをSVGに解析する方法はありますか?
- 2. ingest-attachmentプラグインを使用してElasticsearch 5.0.0でPDFファイルをインデックスする方法はありますか?
- 3. Elasticsearch ingest-attachmentプラグインを使用してPDFファイルをインデックスする方法はありますか?
- 4. インラインリテラルを解析する方法はありますか?
- 5. PHPを使用してXMLを解析する方法はありますか?
- 6. Elasticsearchでインデックスとインデックスに違いはありますか?
- 7. elasticsearch(レール)でドキュメントのインデックスを作成する方法はありますか?
- 8. ElasticSearchインデックスの問題、タイムスタンプの解析に失敗しました
- 9. UTC + 0の日付をPSTに変換する方法はありますか?
- 10. Pythonでは、特定の値に基づいてファイルをリストに解析する方法はありますか?
- 11. また、スペースを含むelasticsearchのエッジngramを使用してデータをインデックスする方法はありますか?
- 12. 正規表現を使って大きなファイルを高速に解析する方法はありますか?
- 13. elasticsearchでオブジェクトとその参照を使用してJsonオブジェクトをインデックスする方法はありますか?
- 14. DocumentをVoiceXMLDocumentに解析する方法はありますか? [Java - Android]
- 15. 解析中にpyparsing parseResultsを破棄する方法はありますか?
- 16. ElasticSearchまたはTireでインデックスのすべての要素を数える方法はありますか?
- 17. yamlファイルを解析する方法は?
- 18. XAMLファイルを解析する方法は?
- 19. ElasticSearchがYamlでダブルエントリを解析する方法は?
- 20. ファイルを配列に解析するより効果的な方法はありますか?
- 21. 改行のために解析エラーが発生したgitosis.confファイルをプッシュする方法はありますか?
- 22. ダッシュボードからデータベースエントリを解析する方法はありますか?
- 23. XmlDocumentの解析があまり厳しくないようにする方法はありますか?
- 24. elasticsearchでツイッターデータをインデックスする方法は?
- 25. Spark CoreNLP解析のインデックス方法は?
- 26. すべてのドメインコンピュータを.pstファイル用にスキャンする必要があります
- 27. HTML解析ライブラリはありますか?
- 28. この石鹸レスポンスを解析する方法はありますか?
- 29. このマップを解析する良い方法はありますか?
- 30. 言語サービス:解析を強制する方法はありますか?
は、私はいくつかの質問を持っているあなたの愛する@erikに感謝: 私はどのようにかどうかを確認することができます私のファイルはbase64ですか? このプラグインを使用する方法は?今はインストールしましたが、使用方法はわかりません。私は弾力性がとても新しいです。私はjsonファイルを読み込んで、弾力的にそれを問い合わせることができましたが、pstファイルのこのアクションの仕方はわかりません。 Javaで –
Base64でエンコードするファイルはここで見つけることができます。https::http://stackoverflow.com/questions/13109588/base64-encoding-in-javaここでは、インジェストプラグインへのPUT呼び出しでデータをロードするには、いくつかの例がある// WWW .elastic.co /ガイド/ EN/elasticsearch /プラグイン/マスター/使用-取り込み-attachment.html – Erik
エリック私は間違いがあると思います。私はファイルをエンコードしたくないのですが、base64であるかどうかを確認したいだけです。 は、第2のリンク私はすでに、それはファイルからインデックスへの負荷情報をカバーしていないこと、しかし読み、 –