pdfminer

    7

    1答えて

    私は、文書内のどのページにある単語があるかを見つけるための洗練されたソリューションを探しています。 私は最初に.docx形式を入力と見なし、検索機能を持つPythonDocxを見ましたが、実際にはdocx/xml形式のページ属性ではありません。 文書を解析すると、xmlツリー内で<w:br w:type="page"/>の出現を探すことができますが、残念なことにこれらは非強制ページ区切りを表示しま