2011-08-10 16 views
-2

"。"を使用して段落を分割したい。オペレーター。 しかし、私はそれをいくつかのケースで分割したくありません。どこと同じように。 "Dr."、 "Mrs."、 "Miss"のような言葉が付いてくる。いくつかの他の言葉。段落を分割する

C#でもSQL  でも、ロジックが必要です。

+0

しかし、すべての期間が段落の終わりを示しているわけではありません。あなたはその期間に分割することがあなたが必要とするものを達成すると確信していますか? –

+2

あなたが最初に言葉で表現することができる論理を見つけようとしてください、そこから行く... –

答えて

1

私は「それはコンポーネントの文章だにどのように私は段落を分割するのですか?」と、質問を読んでそれはあなたが何を意味するかだ場合は、ここで私が問題にアプローチする方法をです:

  1. の「ホワイトリスト」を構築文中の許容可能な使用時間
  2. 段落を "。"で分割します。それが一致した場合、次とその可能性の文章を組み合わせて文章
  3. の内側に許容可能な期間の使用状況のあなたのホワイトリストに対して終了文字をチェックし、あなたの可能文をループ
  4. (これらの可能な文章を呼び出す)、そして再び
  5. をそれをチェック

あなたの本当の問題の範囲を知らないので、私はこのアプローチが実際に実現可能かどうかは言えません。

より堅牢な英語のパーサーを探しているなら、ここには(possibly) related questionがありますが、その質問はJava用です。