0
0, 1, 2
で構成された(1行から次の長さが不均一な)データフレームに列があります。 (文字列は、必ずしも数値である必要はありません。彼らは、文全体にわたる音節にストレスの度合いを表す。)(非常に単純化された)例最小:私は必要なものR - 一意の2桁と3桁の文字列の部分集合を抽出して数えます。
> df
a b
foo 0100101
bar 01201
は、すべての2-もしくはを提供してデータフレームでありますその列内に3桁の組み合わせ(数値はそれ自体で発生する可能性があります。例:00
)と、データフレーム全体の各組み合わせの合計数です。 (各行のカウントもいいだろうが、私はそれはいくつかの整形を取る恐れ、それが今の私の目標ではありません。)省略望ましい結果:
> output
combo count
00 1
01 5
10 2
...
001 1
010 2
...
のように。私はstr_count
に多数のバリエーションを試してみましたが、成功しませんでした。