に1つの文字列のすべての組み合わせに一致する私は2番目の文字列の列に一致/ファジーマッチする最初の文字列のすべての組み合わせをカウントしようとしているデータフレームにRワード数 - 別の文字列
例:
がstring1 = "米国、カナダ、英国、オーストラリア、日本、インド、」 string2の= "USAカナダ、インド、英国、オーストラリア、中国、ブラジル、フランス"
期待される結果
シングルワードマッチカウント= 5(USAカナッド英国、オーストラリア、インド)= 2(米国、カナダ、英国、オーストラリア)の連続した単語が
三ワードマッチカウント= 0
4本のワードマッチカウント= 0
にマッチした2つのワードマッチカウントを一致
ファイブ単語マッチカウント= 0
六単語マッチカウント= 0
合計= 5 + 2 = 7
で
お時間をいただき、ありがとうございますと偉大な誰かがこの関数を記述したり
tm'と 'quanteda' – HubertL
単一ワード整合のナイーブバージョン'パッケージ内ngram' 'のためのルック - '交差(strsplit(文字列1、 "\\ S +")[[1]]、strsplit (string2、 "\\ s +")[[1]]) ' - しかし、正式なパッケージを使うほうが良いでしょう。 – thelatemail
パッケージ参照のためのHubertLありがとう – prav