私はdocxドキュメントを開いて、他の人が文字を置き換える小さなプログラムを構築しようとしています。文書をチェックした後、古い学校のシーザルスタイルの暗号化を行います:[https://python-docx.readthedocs.io]恐らくオブジェクトのメソッドや属性を見つけることができないのですが、ドキュメントでは段落やセクションの作成などの特定の作業を行う方法について説明していますが、ドキュメントデータの取得や解析には何も見つかりません。ドキュメント内のオブジェクトのリストを探して、それらを解析できるようにしたいと考えています。python-docx - 文字の置き換え
私はこのような何かをしたいと思います:
from docx import Document
document = Document('essay.docx')
paragraph = []
for i in document:
paragraph.append(i)
for i in paragraph:
for y in i:
y.replace("a", "y")
...
のdocx-PYTHONこのような何かを行うことができますか?もしそうなら、どのように私にそれを行うことができるドキュメンテーションを見つけることができますか?
おそらく私が間違ったライブラリを使用している場合は、それを指摘できれば幸いです。
うん、私はあまりにもそれらのページを読んで、私はそのような「add_paragraph()」と「add_run()」などの方法を見つけましたが、私は「get_paragraph()」のような方法を見つけることができませんでした。オブジェクトを解析して新しいファイルを作成するように変更する必要があります。おそらく、このライブラリはdocxドキュメントを作成するためにしか動作しますが、そこからデータを取得することはできません。 – andrralv
Documentオブジェクトを調べます。私はあなたが 'Document.paragraphs'を探していると思います。 – scanny
答えがあまりにもハッキリなようですが、Word文書を実際に解凍すると、とりわけ、書式なしのテキストを含むテキスト文書が返されます。私はこのライブラリに精通していませんが、悪化した場合は、1つのユーティリティを使用して解凍し、テキストを読み、不要な部分を削除してから、このライブラリを使用して必要なドキュメントを作成できます。 – Jeff