2017-10-17 6 views
-1

私は分析に関連したプロジェクトを行っています。そのために私はMSのワードからいくつかの行の値を数える必要があります。拡張子が.docxの場合は問題はありませんが、拡張子が.docの場合、そのファイルを読み込むことはできません。私はそれのために何をすることができますか?私はPython 3.6を使用しており、.docxモジュールもインストールしています。良い答えを期待する。前もって感謝します!PythonでMS WORD(2003)のdocファイルを取り出す方法

答えて

1

あなたはこの使用win32com行うことができます。今、あなたは、この文書でやりたいことができ

import win32com 

from win32com.client import gencache, constants, Dispatch 
# that's the magic part 
gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 3) 

app = Dispatch("Word.Application.8") 
# open a document 
app.Documents.Open("MyDocument.doc") 

を。 gencacheとのラインはあなたにエラーを与え、あなたが実行することにより、最初のCOMモジュールを作成する必要があります場合は、次の

lib\site-packages\win32com\client\makepy.py 

これがポップアップします、あなたが「Microsoft Wordのオブジェクトライブラリ」を選択する必要があるウィンドウ。

関連する問題