nlp

    26

    7答えて

    タイトルを入力した後に表示される関連する質問と、質問を表示するときに右側のバーに表示される質問は、非常に適切な質問を示唆しているようです。 スタックオーバーフローはSQLの検索であり、特殊なアルゴリズムは使用されていないとSpolsky氏は語っています。 このような場合に適切な答えを出すためには、どのようなアルゴリズムが存在しますか。 このような場合、Uはどのようにデータベース検索を行いますか?タ

    2

    3答えて

    ディスカッションフォーラムデータベースでフルテキスト検索を実装しましたが、私はGoogleが行うように検索結果を と表示したいと思います。非常に長いhtmlページであっても、検索結果リストに表示されているテキストの行数は2つまたは3つだけです( )。通常、これらは、検索用語を含む の行です。 テキスト自体と検索語句に基づいてテキストの数行を抽出する方法の良いアルゴリズムは何でしょうか。私はテキスト

    0

    1答えて

    ルビーで与えられたテキストまたはテキストグループ(データベースから取り出されたもの)のなかで最も再現されているものは何ですか? 誰もがベストプラクティスを知っていますか?

    3

    4答えて

    私は文章の中にPDFのページのオフテキストを解析しようとしていますが、それははるかに難しい、私が予想していたよりもです。ピリオドを含むが、必ずしもその文を終わらせるものではない、イニシャル、小数点、引用など、考慮すべき特別なケースがたくさんある。 ここで誰もが、このタスクで私を助けるか、ただのアドバイスを提供できることをCまたはC++のためのNLPライブラリに精通していた場合、私は興味がありました

    1

    1答えて

    私は、ドキュメントの束の中の単語の位置をインデックスするテーブルを持っています。 私はセット内で最も一般的なバイグラムを特定したいと思います。 どうすればMSSQL 2008? テーブルには、以下の構造を有する:。私は複雑なのいくつかの種類をジョインをやろうとしている...と私はちょうどで私の頭をやっていることについて考えている LocationID -> DocID -> WordID -> L

    3

    1答えて

    まったく見つからずにグーグルで回っていたので、Domain Specific Languageのような任意の種類の言語を解析するのに役立つクラスやライブラリを知っている人はいません(私は作成していますので、することができます)どちらかのPHPコードまたはいくつかの有用な構造体またはクラスのhiearchyまたは...?何でもこの時点で行く。 :) テキストファイルを構文解析して、小さな文法と構文ラ

    1

    1答えて

    私は英語でクエリを取り、ロシア語で文書を検索するクロス言語情報検索に取り組んでいます。このシステムを評価するには、検索するロシア文書のコレクションを用意するのが良いでしょう。誰もが私が検索することができる文書のコレクションを知っているか、私は簡単に一緒にロシア文書(ウィキペディアを除いて)の束を掻き集めることができますか?彼らは人間の知識のいくつかの特定の領域にあった場合、それはいいだろうけれども

    8

    6答えて

    適切な記事(a/an)を使用している間、文に正しく名詞を挿入する文化的に敏感な方法を探しています。 String.Formatを使用するか、これを行う適切な方法が他の場所に存在する場合は、何か他のものを使用できます。 ベース文:「あなたが見ている/ {0}」 これはにフォーマットする必要があります。「あなたはニンジンを見ている」または「あなたが見ている例えば 卵。" 私は現在、挿入する単語の最初の

    1

    5答えて

    テキストのブロックにすべての可能なフレーズを作成するアルゴリズムが必要です。たとえば、テキストで: "My username is click upvote. I have 4k rep on stackoverflow" それは以下の組み合わせを作成します。 "My username" "My Username is" "username is click" "is click" "

    86

    3答えて

    あります。私はここで私を助けることができる良い図書館を探しています。私は 'LingPipe'に出くわしましたが、それを使う方法を完全に追うことはできませんでした。 は基本的に、我々は、アプリケーションが平易な英語で入力した顧客の指示(配送指示)を解読できる機能を実装する必要があります。例: 6月10日12時00分正午明日 要求出産後にピックアップします が順番 にXYZの10個の以上のユニットを