-3
".doc"、 ".docx"という単語文書を解析して、golangを使用してすべてのテキストを取得するにはどうすればよいですか?golangを使用してすべてのテキストを取得するための.docと.docxを解析しますか?
".doc"、 ".docx"という単語文書を解析して、golangを使用してすべてのテキストを取得するにはどうすればよいですか?golangを使用してすべてのテキストを取得するための.docと.docxを解析しますか?
あなたはそれらのプロジェクトからいくつかのインスピレーションを得ることができます:
https://github.com/nguyenthenguyen/docx
https://github.com/opencontrol/doc-template
基本的には、DOCXはそれでXMLSでZipファイルです。 すべてのテキストは内部にありますdocument.xml
両方のプロジェクトは、すべてのXMLタグを削除し、テキストのみをそのまま残します。そのアプローチがあなたにも合っているかどうかを確認する必要があります。
なぜこれがダウンリストされましたか? Googleの最初の結果.. – DMin