こんにちはコミュニティ!Pythonを使用してLibreOfficeとMicrosoft Wordで* .docファイルを開く3.6
私のクライアントはMicrosoft Word文書を使用しています(これらのファイルの名前は省略していますが、その多くは "ś..doc"などの愚かな名前です)。それらの文書を例えばUbuntuでEclipse env Python 3.6を使用していますか?
私はWindows 7オペレーティングシステムを使っていましたが、いくつかの変更が必要なので、私はUbuntu 16.04 LTSをインストールしました。環境(Eclipse oxygen 4.7.0)、pydevなどをダウンロードしました...しかし、 * .docファイルとして保存されます。
これらのファイルを開く方法はありますか?あなたは何を提案しますか?私は間接的な* .xmlファイルの王様について考えていましたが、LibreOfficeソフトウェアの* .docファイルを開くためにどのような種類のlibを使うべきですか? (私はUbuntuの下にMicrosoft Wordをインストールするためにいくつかの "ハック"を使いたくない)、ファイルからデータを取った後にはどうするのだろうか? ubuntuの下で* .docファイルにデータを保存するには、どのようなlibを使用しますか? *として保存
をスキーマはUbuntuの下のPython 3.6と
- オープン* DOCファイルに簡単です(私のクライアントは、Microsoft Officeとそれを開けます原因) .docファイルはubuntuの下にあります。
いくつかのCOMオブジェクトを使用して、異なるオペレーティングシステムでファイルを開くことはできますか?誰かがubuntuの下でPython 3.6で使われているCOMオブジェクトの何らかの "ドキュメンテーション"を共有することができますか? (私が間違っていると申し訳ありませんが、私はCOMオブジェクトを使用することができると聞きましたが、以前は使用していません)
すべてのリプレイをありがとう、 Greetingsコミュニティ! Eldiane
イェジン、罰金のようですが、私は* .docxファイルの代わりに* .docファイルを持っています。私が知る限り、* .docxファイルはzip形式のxmlファイルなので、オープンするのは簡単です。 * .docファイルを開くときに使用できますか?python docx lib(またはそれ以外)? Microsoft Wordのない* .docファイルをどのように開くのですか? – Eldiane
あなたは完全な書式のdocファイルまたはdocファイルのテキストだけを望みますか? – varnit
残念ながら、私は全ての "白い文字"ですべてのコンテンツを必要とします。ユーザーはNoobです(神は私の昇天のために私を許しています)彼らは文書を書くためにどんな種類の書式も使いません。多くのスペース、タブ、改行、\ r文字があります(* .docファイルに文字がどのようにコード化されるかは次の質問です)。しかし、私はデータを抽出するためにRegEx libを使用しました。私はいくつかのpythonスクリプトのようにテーブルとして取得しました。だから、ubuntuで同じことをするのは問題にはなりません。 – Eldiane