text-segmentation

    0

    1答えて

    プロジェクトで「テキスト境界解析」を行う必要があります。 Googleからのリソースがこの仕事をするのに役立つかもしれないことを覚えていますが、名前やダウンロードする場所を覚えていません。 私はこのリソースがGoogle検索の集団統計データであることを覚えています。人々が検索エンジンでキーワードとして使用した多くの単語が含まれている可能性があります。 (実際には、私はこの記事を長い時間前に読んだの

    19

    6答えて

    この問題を解決するには、動的プログラミングアルゴリズムを見つける必要があります。私は試しましたが、それを理解できませんでした。 あなたはn文字の文字列s [1 ... n]が与えられます。これは、句読点がすべて消えている破損したテキスト文書と思われます(itwasthebestoftimesのように見えるようになります)。 ... ")。任意の文字列wに対してdict(w)が有効な単語であれば値1

    11

    5答えて

    私は長さと内容の異なる文字列の配列を持っています。 今、私は各単語の最後の単語を抽出する簡単な方法を探しています。その単語の長さや文字列の長さはわかりません。 何か; array.each{|string| puts string.fetch(" ", last)

    15

    3答えて

    私は、クメール語(カンボジア語)の長い行を個々の単語(UTF-8)に分割するソリューションに取り組んでいます。クメール語は単語間にスペースを入れません。そこにはいくつかの解決策がありますが、それほど適切ではありません(hereおよびhere)。これらのプロジェクトは道端になっています。ここで を分割する必要がクメールのサンプルライン(彼らはこれ以上長くすることができます)です。 ចូរសរសើរដ

    1

    3答えて

    私は基本的に段落を含む文字列を持っています。改行がある可能性があります。 文字列の最初の文だけを取得したいと考えています。 私は試してみると思った。 これは空白のドットである。 問題は、これはfirstName. LastNameなどの行では機能しません。 私は.Netを使用しています。これを達成するための良い方法がありますか? また、Javaにタグを付けて検索範囲を絞り込むことができるかどうかを

    -6

    2答えて

    有効な単語を含む辞書があるとします。 すべてのスペースが削除された入力文字列が与えられた場合、その文字列が有効な単語で構成されているかどうかを判断します。 辞書は、O(1)ルックアップを提供するハッシュテーブルであると仮定できます。 これについては繰り返してください。私は本の中でこの質問を見つけましたが、この本は無回答です。

    1

    1答えて

    文章を取り、最初の単語以外のすべての単語を削除する方法を見つける必要があります。 文が 「こんにちは私の名前はディンゴある」されている場合は、私は唯一の単語「こんにちは」