PDFドキュメントからテキストを読み込むための関数を書きました。 中古のスケーラ言語、Selenium、PDFBox 2.0.1。以下はScalaのPDFBoxエラー
コードです:val parser: PDFParser = new PDFParser(fileToParse)
enter code here
import org.openqa.selenium.firefox.{FirefoxBinary, FirefoxDriver, FirefoxProfile}
import org.apache.pdfbox.pdfparser.PDFParser
import org.apache.pdfbox.text.PDFTextStripper
import java.io.BufferedInputStream
def pdfreaddata {
driver.get("https://www.....pdf")
driver.manage.timeouts.implicitlyWait(50, TimeUnit.SECONDS)
val url: URL = new URL(driver.getCurrentUrl)
println(url)
val fileToParse: BufferedInputStream = new BufferedInputStream(url.openStream())
val parser: PDFParser = new PDFParser(fileToParse)
parser.parse()
val output: String = new PDFTextStripper().getText(parser.getPDDocument)
println("pdf Value" + output)
parser.getPDDocument.close()
driver.manage.timeouts.implicitlyWait(100, TimeUnit.SECONDS)
}
エラーメッセージ:
はコンストラクタ
があまりにもJavaでコードを試してみました解決できません。 、同じエラーが発生します。
正しい呼び出しは、PDDocument doc = PDDocument.load(stream)です。新しいPDFParser()を使用するのは時代遅れの方法です。しかし、それがあなたの悩みの原因であるかどうかはわかりません。 –