オブジェクトをワードドキュメントで書かれた順番で処理したい。私が遭遇したオブジェクトは、段落、段落内のテキスト、段落内の段落、実行中のテキスト、表、段落などです。これまでは2つの便利なプログラムがあります。 文書の段落を通過し段落のテキストを取得するもの。 [paragraph#]で索引付けされたリストに格納されます。この同じプログラムには、実行からテキストを収集する機能があり、[段落番号] [実行番号]でインデックス付けされた2Dリストに格納されていますが、段落のテキスト全体よりも便利なランが見つかりませんでした。 私の2番目のプログラムは文書全体を調べ、テーブルを見つけます。テーブルがあると、行、セル、およびセル内の段落ごとにテーブルを通過します。docxで順にオブジェクトを処理する
これは私の目標にとって大きなビルディングブロックのようです。私は順番にテキストを集めたいと思う。抽象的には、あたかもキーボード上の右矢印を押した人が動くように点滅するテキストカーソルが命じられているかのように。テキストカーソルがオブジェクト上を移動するにつれて、オブジェクトの#とオブジェクトのタイプを示すいくつかのインデックスによってそれらを格納しています。
私はサブ関数paragraph_readとtable_readを持っているとします。文書にこのオブジェクトの順序があるとします。これらの項目を順番に実行したいと思います。paragraph_read、paragraph_read、table_read、paragraph_read
私のプログラムがカーソルをスワイプするようなオブジェクトによってドキュメントオブジェクト内を移動できるかどうかを知りたいと思います。
ヘルプが大きく改善されました。ありがとう。あなたがどこかに便利なコードにこの機能を追加する必要が
-Chris
について説明し、いくつかの議論と、ここでコードがありますそれは:https://github.com/python-openxml/python-docx/issues/40です。最新バージョンに対応するためにいくつかの更新が行われた場所を最後まで見てください。 – scanny
それはまさに私がやろうとしていることです。ポインタありがとう。 -Chris – Chris
@scannyこのページのコードの理解に問題があります。あなたは私に話すことができますか?それとも何かをするためのヒントを教えてください。 – Chris