similarity

0熱

2答えて

ヘイズ、類似度indiceを計算して、行が 'simialr'でない場合は+1を取得したいと考えています。 dataR<- read.table(text=' echant espece ech1 esp1 ech2 esp2 ech3 esp2 ech4 esp3 ech5 esp3 ech6 esp4 ech7

1熱

1答えて

nltkで関数をオーバーライドする - ContextIndexクラスのエラー

nltk.Textモジュールのtext.similar('example')関数を使用しています。（どのプリントコーパスに基づいて、指定された単語のための類似した単語。）私は、リスト内の単語のリストを保存したいが。しかし、関数自体はNoneを返します。 #text is a variable of nltk.Text module simList = text.similar("physic

0熱

3答えて

C＃foreach inside whileループ

私は文字列のリストを持っていますが、私はデータベースに挿入しようとしている新しいレコードが既にデータベースにあるものと似ているかどうかを確認するためにLevensteinアルゴリズム（または他の方法）。アルゴリズムは、リスト内のすべての単一項目を通過し、挿入したいものと比較する必要があります。類似性が高い場合は、ループを解除して戻ります。私は開始しましたが、わかりません。正しい方法であれば。

0熱

1答えて

R大きなラスタのためにEarth Moverの距離を計算する

emd2d（emdistライブラリから、バージョン0.3-1）で2つのラスタ間の（dis）類似性の定量的な見積もりを得ようとしています。、EMDR（A、B、DIST = distの中エラー：次のコードは、小さな行列（〜35x35）の罰金動作しますが、私のラスタは（〜5000x3000）はるかに大きいと私はメモリエラーを取得しています。 ...）：ここではemdistで）-1608.8 MB

0熱

1答えて

文字列の類似性を測定するためのJaccard係数の使用

文字列類似性測定に使用するテストとトレーニングデータセットを取得しました。トレーニングセット（35個のサンプル）およびテストセット（15のサンプル：我々は2に設定されたデータを分割する必要がTwitterの話題 TWEET_SENT_1 – Tweet sentence 1 TWEET_SENT_2 – Tweet sentence 2 HAVE_SIMILAR_MEANING – a bin

-1熱

1答えて

wekaのKNNのGower's Distanceの使い方は？

現在、私はKNN分類に取り組んでおり、データセットにカテゴリ変数と連続変数の両方を持っています。だから私はKNNの類似性測度としてGowerの距離を使うことにしました。しかし、KNN分類のためにgowerの距離はwekaでは利用できません。 wekaを使用してKNNにGowerの距離を使用する方法はありますか？可能であれば、どうすれば実装できますか？

-1熱

3答えて

英語の単語間の類似度を計算するにはどうすればよいですか？

英語の単語をその発音に従って文字列にエンコードする多くの一般的なアルゴリズムがあります。例えば、soundexコードは、1文字の後に3つの数字が続く4文字の文字列である。 0と1の間の類似度スコアを効率的に計算する方法はありますか？

-1熱

3答えて

リストのリストに類似の要素をグループ化する

リストが[ [0], [0,1], [1,2], [3] ]であり、同様の要素をまとめてグループ化しようとしています。出力は[ [0,1,2], [3] ]である必要があります。これは、リストのリスト内の同様の要素をグループ化しています。これを行うための好ましい方法はありますか？

0熱

1答えて

Matlab 2D関数のサブシーケンスの類似度

2つの関数がある場合、f（x）とg（x）とし、gの一部分に似たfの最長部分を探したいと思います。彼らは開始位置で互いに類似十分ですが、彼らはランダムな位置にどのようなところならば、それはかなり明白である：たとえばは、以下の図を検討しますか？それはポイントです、私は最も長い同様の部分を発見する必要があります...いくつかのヒント？私の場合、2つの「機能」とは、2つの曲の配列rappresen