0
結果のdtm行列を調べると、設定がFalseに設定されていない限り、トークンは小文字であることがわかりました。さらに、トークン化の前にアンダースコアのある単語を分割しました。RのパッケージtmのDocumentTermMarix関数に対するデフォルトの制御設定は何ですか?
documentationを検索すると、デフォルト設定を取得できませんでした。また、明示的な制御がない場合にはどの設定が使用されましたか。
どこでこれを見つけることができますか?
OPの場合、投稿のタイトル(DocumentTermMatrix)で1つの関数を参照しているにも関わらず、別の関数(TermDocumentMatrix)のドキュメントへのリンクを提供していることに注意してください。 –
ありがとうございます。私はそれが見えないのは私にはうんざりだと同意しますが、もしあなたがGoogleの "Term-Document Matrixのデフォルト設定"であればこれが表示されるので、ここで質問を残します。いくつかに役立つ。 – user1603472