2011-12-20 5 views
1

私は、テキストが与えられたときにそれをスマートにセンテンスにカットするアルゴリズムを探しています。今のところ私は指定した1文あたりの単語数で動作するアルゴリズムを持っています。私はそれが最初の 'まで働くように変更することができます。そのようなものだが、私が必要とするのは、やや論理的に行うことができるアルゴリズムである( 'と'、 '、そしておそらく'。 '以外の句読点を探す)。テキストをスマートにカットするためのアルゴリズムですか?

アイデア? 私はPHP5を使用しています。 preg_split

+1

必要なものについてもう少し正確にお答えください。たぶん例である –

+0

は、あなた自身が多分最初の後に終わりのような何かを書く必要があります。 OR! OR? 300番目の文字の後に、350番目の文字の後に最初の空白で350番目の文字の終わりまで見つからない場合は、 – Hannes

+0

私は自分でアルゴリズムを書くことができますが、ほとんどの人が使っているものを見つけることができればそれほど良くありません。 – Vadiklk

答えて

1

使用このコードを:

$sentences = preg_split("/[,.:;]+/", "Now you can split in sentences, try this. Isn't it good?"); 

それは「。:;」あなたは私が使用した上記の例では(使用したい文字を選択する必要があり、文章の配列で、あなたの文章を分割します)。 正規表現を使用すると非常に便利です)

+0

問題は、 '、'、 '。'が削除されてしまうことです。後にこれらの文章をまとめて原文を作成したいと考えています。 – Vadiklk

+0

mmmもっと難しいです...何かを検索しようとしています –

関連する問題