MSWordの.doc/.docxファイルをプレーンテキスト形式に変換するためのc/C++オープンソースライブラリはありますか?.docプレーンテキストコンバータ
4
A
答えて
3
あなたがこの(同様の質問)に見ることができます。
How to extract plain text from MS word document file in pure C++?
1
私は、このタスクのためのライブラリーについては知らないが、おそらくあなたはAntiwordから重要なビットを抽出することができます。私はアンチワードがdocxを扱っているかどうかわからない。
2
2
その他すべてが失敗した場合、.docxファイルは実際にはいくつかのディレクトリがあるZIPファイルです。これらのディレクトリの1つにあるファイルの1つに、マークアップ付きのXMLとして文書テキストがあります。行の終わりをマークするので処理する必要のあるタグがいくつかありますが、そのほとんどは自動修正がさまざまな項目にフラグを立てた場所や、マークアップの書式設定に含まれるランダムに分散された5レベルのネストされたタグです。
(ノーインターネットアクセスをマシン上で一度手でこれをしなければならなかった。誰かがオフィス2011でファイルを保存し、booniesに友人の場所でのOffice 2005またはそうでそれを開きたいと思いました。)
関連する問題
- 1. Django Doc
- 2. opensource office DOCリーダー
- 3. コードイグナイターDoc Type
- 4. のdoc /スキーマ
- 5. は.RTF/.docファイル
- 6. Google Docのスクリプト
- 7. Kotlin Generate Comment Doc
- 8. Sharepoint Doc Libコンテンツタイプ
- 9. PSR docコメント
- 10. Doc to PDF + Openoffice
- 11. Confl doc with coldfusion
- 12. アプレットDjnlp.versionEnabled doc
- 13. doc、pdf、xls、
- 14. HTML5 doc from HAML
- 15. LibreOffice Doc to PDFセキュリティ
- 16. Migra Doc PDF Footer Styling
- 17. Python WikiスタイルDoc Generator
- 18. VisualStudioのc#-doc-viewer
- 19. AWS Cloudsearch doc upload url
- 20. Pdf to doc/docx converter
- 21. Doc、ppt、xls mimeタイプ
- 22. Spring REST Doc unamedリクエストパラメータ
- 23. doc/docx to postscript/ps
- 24. Salesforce doc、 ' - 'の意味
- 25. ASP.NETのModyfy .docファイル
- 26. コンストラクタxml doc in F#?
- 27. apache .gz Linuxドキュメントのgzipコンテンツハンドラ/ usr/share/docとlocalhost/doc/
- 28. .docファイルの動的生成
- 29. XMLの属性値DOC
- 30. show docファイルの問題
Michael PalinまたはSarah Palin? –
@ Paul Michael Palin。常に。 – Bojangles
http://blog.stackoverflow.com/2010/11/qa-is-hard-lets-go-shopping/ –