私は特にディレクトリのセットを持っています。ファイルから単語を取り出すための正規表現
ディレクトリ内のすべてのファイル(テキストファイル)から内容を取得した後、私は ストリングのリストを持っています。
各文字列要素は、各ファイルから取得されたコンテンツを表します。したがって、リストの最初のString要素は、最初のファイルの内容を表します。
ここで、単語を取得するために文字列を分割したい(後で単語が文字列の配列に格納される) 1)単語は単一のスペース/複数のスペースで区切ることができます。 2)文は '。'で終わります。したがって、 '。'の後ろに新しい単語を入れることができます。 3) '\ n'の後ろに新しい単語を書くことができます
誰もがsplit()メソッドに適合する正規表現を提案できますか?
これはおそらく非常に似て質問です:http://stackoverflow.com/questions/2159026/regex-how-to-get-words-from-a-string-c – wlk
しかし、それは、C#でだ、ではありませんでJava –