私は、次のURLで探しています:しかし奇妙なPDFテキスト抽出ケース
uNISON LAuNCHeS MAGHReb VIRTuAL SCIeNCe LIbRARy: A NeW
PORTAL PROMOTING INTeRNATIONAL SCIeNTIFIC AND
TeCHNICAL COLLAbORATION
: はhttp://www.unisonagency.com/assets/news/unison_pr_mvsl.pdf
私が試したオープンソースのテキスト抽出ツールはすべて、見出しについては、以下の私に与えますAdobe Acrobat Readerはもっと合理的なものを提供します -
Unison Launch es Maghr eb Virt ual Sci enc e
Librar y: A New Portal Promoting Int ernational
Scientific and Technical Colla boration
スペースはオフですが、文字の区切りは意味があります。矛盾がそこにある理由は何ですか?