2017-08-11 6 views
0

結果のdtm行列を調べると、設定がFalseに設定されていない限り、トークンは小文字であることがわかりました。さらに、トークン化の前にアンダースコアのある単語を分割しました。RのパッケージtmのDocumentTermMarix関数に対するデフォルトの制御設定は何ですか?

documentationを検索すると、デフォルト設定を取得できませんでした。また、明示的な制御がない場合にはどの設定が使用されましたか。

どこでこれを見つけることができますか?

答えて

1

DocumentTermMatrixのドキュメントには、「使用可能なローカルコントロールオプションについてはtermFreqを参照してください」と記載されています。

そうした場合:

?termFreq 

をあなたは(あなたが参照している「tolowerデフォルトは」を含む)は、デフォルトですべての可能なオプションが表示されます。

+0

OPの場合、投稿のタイトル(DocumentTermMatrix)で1つの関数を参照しているにも関わらず、別の関数(TermDocumentMatrix)のドキュメントへのリンクを提供していることに注意してください。 –

+0

ありがとうございます。私はそれが見えないのは私にはうんざりだと同意しますが、もしあなたがGoogleの "Term-Document Matrixのデフォルト設定"であればこれが表示されるので、ここで質問を残します。いくつかに役立つ。 – user1603472

関連する問題