1
MSドキュメント(.docx .xlsなど)/ .pdfをアップロードしてこれらのファイルから単語を検索するにはどうすればよいですかJava APIMarklogic Docxタイプ(txt、json、xml以外)ドキュメントのアップロードとファイルでの検索
私は、私はロジックとコードと同じ、私を助けてください、以下
GenericDocumentManager manager = client.newDocumentManager();
StringQueryDefinition query =
queryMgr.newStringDefinition().withCriteria("pavan");
DocumentPage documents = manager.search(query, 1);
while (documents.hasNext()) {
DocumentRecord document = documents.next();
System.out.println("document" + document.getContent(new StringHandle()));
}
を試してみましたが、検索するのdocxファイル
InputStream docStream = Example.class.getClassLoader().getResourceAsStream(
"data"+File.separator+"Resume.docx");
GenericDocumentManager manager = client.newDocumentManager();
DocumentMetadataHandle handleMetaData = new DocumentMetadataHandle();
// create a handle on the content
InputStreamHandle handle = new InputStreamHandle(docStream);
// write the document content
manager.write("/example/resume.docx", handleMetaData, handle);
をアップロードするには、以下試してみました。
これをお寄せいただきありがとうございます。パイプラインをインストールしてファイルをアップロードすることができました。私はPDFをアップロードすることができます、私はそれが処理され、XMLが生成されることがわかりました。しかし、私が探しているとき、それは結果を返さない。ドキュメント(.docx)の場合、それは処理されておらず、デフォルトの変換を行わない – Pavan