2009-07-13 5 views
0

msオフィスのドキュメント(ワード、エクセル、パワーポイント)から生のテキストを読み込み、別の単語リストとカウントを表示する効率的な方法を探していますその言葉が何回使用されたか。可能であれば、私は一般的な単語( 'と'、 '〜'、 '〜'など)を除外したいと考えています。C#を使用してmsオフィスのドキュメントから別個の単語リストとカウントを取得

私はC#でこれを実現できる最良の方法は何ですか?

答えて

1

あなたはLucene.NETを調べる必要があります。これは、私が信じるように、さまざまなソースからワードインデックスを構築する能力を持っています。

関連する問題