私はパッケージtmを使用しています。DTMのトップフィーチャをId(同じIDを持つ複数のドキュメントが含まれています)から検索します
私は2列のデータフレームを持ち、最初の列はIDで、seocnd列はテキストを含んでいます。データフレームは次のようになります。
Id Term1 Term2 Term3 Term4 Term5
13456 Hi Good morning term4 term5
13457 How are you term4 term5
13456 I Know may who to
13456 Hi Good Evening term4 term5
しかし、必要な出力は次のとおりです:
Id Term1 Term2 Term3 Term4 Term5
13456 Hi Good I morning evening
13457 How are you term4 term5
私はTMパッケージを使用してDTMを構築し、各ドキュメントのためのトップ5の単語を抽出し、それがどのように見えるしている
Id Text
13456 Hi, Good morning
13457 How are you?
13456 May I know who I am speaking to?
13456 Hi, Good evening
私はこの上に掲載された以前の質問を見つけることができませんでした。 ありがとうございました。
試してみるために使用した機能を明示的に与えることができますか? – denis