2017-04-11 73 views
0

私は、Python内で.docx形式の多くのMicrosoft Word文書をバッチ処理しようとしています。python-docxを使用して.docxを読み込み、特殊文字を保持する、箇条書き

次のコードは、右矢印記号や箇条書きのように保存したい特殊文字を失うことを除いて、必要なものを実現します。 python-pptx

import docx 

def getText(filename): 
    doc = docx.Document(filename) 
    fullText = [] 
    for para in doc.paragraphs: 
     fullText.append(para.text) 
    return fullText 

getText('example.docx') 
+1

は、[箇条書きがサポートされていません]のように思える(http://stackoverflow.com/質問/ 33158991/python-docx-lists-showing-as-normal-paragraphs) – fedterzi

答えて

1

Paragraph.textプロパティは、文字列として段落のプレーンテキストを返します。これは非常に一般的な要件です。

箇条書きまたは箇条書きのリスト(一般的な箇条書きの種類)は、段落のテキストには表示されませんが、段落のテキストには反映されません。このようなことは、パラグラフの追加的な特性になります。

「弾丸のリスト」スタイルを使用して弾丸を適用できます。段落スタイルはParagraph.styleにあります。

ここドキュメントはこのおよびその他の詳細については、あなたの友人は、特に、ユーザーガイドセクションの11件のトピック:
http://python-docx.readthedocs.io/en/latest/

関連する問題