私は、.docxファイル内の特定の単語を見つけて、それが発生したページ番号を返すプログラムを、Pythonで作成しようとしています。これまでのところ、python-docxのドキュメントを見ると、ページ番号や番号がどこにあるフッターにアクセスするのか見つけられませんでした。 python-docxを使ってこれを行う方法はありますか?そうでない場合は、これを行うための最良の方法は何でしょうか?ページ番号python-docx
4
A
答えて
3
ページ区切りがレンダリングエンジンによって挿入され、.docxファイル自体では決まっていないため、短い答えはいいえです。
ただし、特定のクライアントは、最後にレンダリングされたページがどこにあったかを示すために、保存されたXMLに<w:lastRenderedPageBreak>
要素を配置します。
これはどのようなことですか(私はWord自体が期待していますが)、どれくらい信頼できるかはわかりませんが、それはPythonで作業したい場合にお勧めする方向です。あなたは潜在的にpython-docxを使用して(例えばw:document/w:body
のような)必要なlxml要素への参照を取得してからXPathコマンドや何かを使って特定のページに進むことができますが、ちょっと考えていくと詳細な開発になるでしょうそれを得るためにそこに。
ネイティブのWindows MS Office APIで作業している場合、実際にWordアプリケーションが実行されるため、何か改善の余地があります。
文書をpython-docxで生成している場合、その文書をレンダリングしようとしない(その可能性もありません)ため、これらの要素は配置されません。また、いつでもw:lastRenderedPageBreakのサポートを追加する予定はありません。私はそれがどのように見えるかは全く分かりません。
'lastRenderedPageBreak'や 'python-docx page break'を検索すると、もう少し分かりやすい質問や回答が表示されます。
関連する問題
- 1. Codeigniterページ番号
- 2. Wordページ番号
- 3. SSRSページ番号
- 4. HTML5ページ番号
- 5. rich:dataScrollerページ番号
- 6. ActiveResourceページ番号
- 7. ページ番号:ハイライト現在の番号ボタン
- 8. Javaページ番号リスト
- 9. データテーブルjQueryページ番号
- 10. Symfony:ページ番号+ソート?
- 11. SSRSのページ番号
- 12. ActiveReportのページ番号
- 13. CakePhp AngularJsページ番号
- 14. mpttのページ番号
- 15. アドバンスCodeIgniterページ番号
- 16. カスタムポストタイプのページ番号
- 17. ordonateページ番号codeigniter
- 18. ページ番号とオフセット
- 19. ページ番号はページ番号に維持されません
- 20. Joomla K2は、ページ番号にページ番号を付け加えてページ番号を変更します。
- 21. Ireportのページ番号をリセット
- 22. DevExpress RichEditマージ改ページ番号
- 23. KendoUIグリッドサーバーのページ番号
- 24. Silverstripeブログアイテムとページ番号
- 25. October CMSバックエンドビューのページ番号
- 26. 週単位のページ番号
- 27. 印刷のページ番号
- 28. ページ番号のPHP配列
- 29. SQLサーバー2008のページ番号
- 30. Laravel whereステートメントとページ番号
迅速な回答ありがとうございます! – lehast22