フリーテキスト文書の任意の箇条書きリストに一致させようとしています。箇条書きリストは、単語区切り記号の前に任意の数字または小文字として定義されます。ですから、例えばJavaの正規表現の箇条書きリストの検索
1. item a
2. item b
のために私は弾丸を見つけるために、次のコードを使用します。
Pattern p1 = Pattern.compile("\\s[\\d][\\.\\)]\\s");
これは、限り箇条書きのリストが一桁の項目で構成されてうまく動作します。しかし、できるだけ早く私は、複数桁の箇条書きリストを試して、それが(例12. item c 13. item d
)が動作しません私は、正規表現言語の私の解釈がある
Pattern p1 = Pattern.compile("\\s[\\d]+[\\.\\)]\\s");
または
Pattern p1 = Pattern.compile("\\s[\\d]\\+[\\.\\)]\\s");
にパターンを変えてみましたこれは、 "。"の前に1桁以上の数字がある場合に一致します。しかし、これは機能しません。
誰かが間違っているのを見ることはできますか?
、あなたが定義することができ 'しかし、これはwork.'ていないのですか? – Thomas
これは、「弾丸リスト」の奇妙な定義です。本当に意味するのは、項目が「弾丸」文字によって導入されるリストです。あなたが探しているものは、文字付きリストまたは番号付きリストの項目です。 – EJP