2009-06-30 7 views
-1

VB.NETを使用して、どのようにしてand、or、to、a、no、withなどの文章を見つけて削除することができますか?また、上記のようにすべての単語リストを見つけることができます。あなたの単語リストをループしたいVB.NETのリストに含まれる文字列を削除するには?

myString.Replace( "および"、 "")

あなたは上記のようなステートメントを持っている:

答えて

4

注: http://en.wikipedia.org/wiki/Stop_word

英語のためのストップワードのカンマ区切りリストがここで見つけることができます:あなたはストップワードのリストで必要なもの

Regex word boundariesを使用しない限り、Scunthorpe (Sfannythorpe) problemの危険にさらされる危険があります。

string pattern = @"\band\b"; 
Regex re = new Regex(pattern); 

string input = "a band loves and its fans"; 

string output = re.Replace(input, ""); // a band loves its fans 

'と'の 'バンド'は触れられていません。

+0

これは交換を行うための最良の方法です。 –

0

あなたは言葉と一致し、正規表現を使用してそれらを削除することができます。

+0

例へのリンクまたは例へのリンクが役に立つかもしれません。 – jao

3

(colithiumが説明するように)あなたが実際に.Replace機能を使用した単語のリストを置き換えることができます...

myString.Replace("and", "") 

編集:

...しかし確かに、Aより良い方法は、単語の一部を置き換えるのを避けるために正規表現を使用することです(edg推奨)。


あなたの質問は、あなたがクリーンアップ文意味のある言葉を保つためにしたいことを示唆しているとして、あなただけの二次元と3文字の単語を削除する以上のことをしなければなりません。 http://www.textfixer.com/resources/common-english-words.txt

+1

良い答えですが、私はString.Replaceの代わりにRegexを使用します。 –

+0

私は同意します...私は答えを更新しました – WowtaH

+0

ストップワードで合意しました。検索エンジンによって「unimprtant」という言葉を捨てるために広く使われています。別のリストはこちらから入手できます。http://www.ranks.nl/resources/stopwords.html – JohnC

関連する問題