0
Apache POIを使用して単語文書からリンクを抽出する方法を知っている人は誰ですか?段落から、またはさらに良い?Apache POIは単語文書のハイパーリンクを抽出します
Apache POIを使用して単語文書からリンクを抽出する方法を知っている人は誰ですか?段落から、またはさらに良い?Apache POIは単語文書のハイパーリンクを抽出します
のWord 2003およびそれ以降:
//Links extractor
StringBuffer text = null;
try {
FileInputStream fis = new FileInputStream(new File("YOUR_DOCX_FULL_PATH_HERE));
XWPFDocument document = new XWPFDocument(fis);
text = new StringBuffer();
// First up, all our paragraph based text
Iterator<XWPFParagraph> i = document.getParagraphsIterator();
while(i.hasNext()) {
XWPFParagraph paragraph = i.next();
// Do the paragraph text
for(XWPFRun run : paragraph.getRuns()) {
if(run instanceof XWPFHyperlinkRun) {
text.append(run.toString());
bean.setName(run.toString());
XWPFHyperlink link = ((XWPFHyperlinkRun)run).getHyperlink(document);
if(link != null) {
text.append(" <" + link.getURL() + ">");
}
}
}
}
} catch (Exception e) {
e.printStackTrace();
}
XWFP/XSSF/XSLFインスタンスは、ファイルがあればInputStreamから開かないようにするのが一般的です。ロット全体をメモリにバッファリングする必要があるからです。 Fileを介して直接開くほうがずっと良い – Gagravarr
オールドスタイル.docファイル、または新しいスタイル.docxのもの? (わずかに異なります) – Gagravarr