この文字列を解析し、太字を抽出する必要があります。 Iは = "0067711990999999 * * 0515070999999999999N9 + 01 * * 1 + 99999999 ..." とすることができる 1 useInputに適した正規表現を持っていけません。文字列内の太字を認識するためのパターンマッチング
Pattern pattern;
String regex="\\s*-?\\d+(?:\\s*[-+/*]\\s*-?\\d+)+\\s*";
pattern=Pattern.compile(regex);
Matcher match = pattern.matcher(userInput);
問題は、私は大胆な文字列にマッチする任意の正規表現を見つけるいけないです。
私はMap-Reduceプログラムでこれが必要です。
おかげ
この文脈では、「太字」の数字は何ですか? – claesv
上記のように** 1955年と温度* 23 *。 –
フォントの変更自体は文字ではありません。おそらく、生の形式でのあなたの入力は、フォントの変更を示すある種のシーケンスを持っています。そのシーケンスとそれに一致すると判断することができます。このシーケンスがHTMLの場合、解析には非常に間違いがあります。 HTMLタグの一致に関する通常の問題とは別に、CSSについて心配する必要があるかもしれません。 – geekosaur