similarity

    0

    2答えて

    ヘイズ、 類似度indiceを計算して、行が 'simialr'でない場合は+1を取得したいと考えています。 dataR<- read.table(text=' echant espece ech1 esp1 ech2 esp2 ech3 esp2 ech4 esp3 ech5 esp3 ech6 esp4 ech7

    1

    1答えて

    nltk.Textモジュールのtext.similar('example')関数を使用しています。 (どのプリントコーパスに基づいて、指定された単語のための類似した単語。) 私は、リスト内の単語のリストを保存したいが。しかし、関数自体はNoneを返します。 #text is a variable of nltk.Text module simList = text.similar("physic

    0

    3答えて

    私は文字列のリストを持っていますが、私はデータベースに挿入しようとしている新しいレコードが既にデータベースにあるものと似ているかどうかを確認するためにLevensteinアルゴリズム(または他の方法) 。アルゴリズムは、リスト内のすべての単一項目を通過し、挿入したいものと比較する必要があります。類似性が高い場合は、ループを解除して戻ります。 私は開始しましたが、わかりません。正しい方法であれば。

    0

    1答えて

    emd2d(emdistライブラリから、バージョン0.3-1)で2つのラスタ間の(dis)類似性の定量的な見積もりを得ようとしています。 、EMDR(A、B、DIST = distの中 エラー: 次のコードは、小さな行列(〜35x35)の罰金動作しますが、私のラスタは(〜5000x3000)はるかに大きいと私はメモリエラーを取得しています。 ...):ここではemdistで )-1608.8 MB

    0

    1答えて

    文字列類似性測定に使用するテストとトレーニングデータセットを取得しました。トレーニングセット(35個のサンプル)およびテストセット(15のサンプル:我々は2に設定されたデータを分割する必要がTwitterの話題 TWEET_SENT_1 – Tweet sentence 1 TWEET_SENT_2 – Tweet sentence 2 HAVE_SIMILAR_MEANING – a bin

    -1

    1答えて

    現在、私はKNN分類に取り組んでおり、データセットにカテゴリ変数と連続変数の両方を持っています。だから私はKNNの類似性測度としてGowerの距離を使うことにしました。しかし、KNN分類のためにgowerの距離はwekaでは利用できません。 wekaを使用してKNNにGowerの距離を使用する方法はありますか?可能であれば、どうすれば実装できますか?

    -1

    3答えて

    英語の単語をその発音に従って文字列にエンコードする多くの一般的なアルゴリズムがあります。例えば、soundexコードは、1文字の後に3つの数字が続く4文字の文字列である。 0と1の間の類似度スコアを効率的に計算する方法はありますか?

    -1

    3答えて

    リストが[ [0], [0,1], [1,2], [3] ]であり、同様の要素をまとめてグループ化しようとしています。出力は[ [0,1,2], [3] ]である必要があります。これは、リストのリスト内の同様の要素をグループ化しています。これを行うための好ましい方法はありますか?

    0

    1答えて

    2つの関数がある場合、f(x)とg(x)とし、gの一部分に似たfの最長部分を探したいと思います。彼らは開始位置で互いに類似十分ですが、彼らはランダムな位置にどのようなところならば、それはかなり明白である :たとえば は、以下の図を検討しますか? それはポイントです、私は最も長い同様の部分を発見する必要があります...いくつかのヒント? 私の場合、2つの「機能」とは、2つの曲の配列rappresen