ファイルをnewdata
のread.csv
を使用して読み取ると、非常に奇妙な問題が発生しました。列のR - 文字列が整数と見なされます
一つは、「サイト」であり、それは文字列でなければならない:
- 私はそのような「www.google.com」などの値が含まれていることがわかり、私はビューを使用してデータフレームを見て、 "www.facebook.com"など
- カラムのタイプが
typeof(newdata$Site)
であることを確認すると、結果は「整数」になります。 table(newdata$Site)
を使用して各文字列の出現頻度を確認し、このテーブルを.csv
ファイルに書き込むと、数値ごとに適切な頻度表が表示されます(数値がない名前の列サイト文字列(例:www.google.com)とvar1
という1つの列と、頻度がFreq
の1つの列)。
複数の値を1つにまとめた新しい列を作成しようとしましたが(例: "Google"に "www.google.com"と "www.google.com")、grepl
を使用しました1で.csv
結果にそれを書いて...私はa = newdata[,"Site"]
によって、この列のサブセットをしようとしたとき、私は a
は型因子であることだ
... Rがない文字列として元の列を扱うことに気づきましたすべての値の長い行....
私は間違って何ですか?私はこれらのものの新しいもので、私は本当に何をすべきかわかりません...
ありがとう!!!
すべての人にとって、単語の束ではなくテキストの書式を設定してみてください。そして、あなたの列が要素であることを確認するために 'str(newdata)'を見てから、因子について検索してください(最初の手順: '?factor') – Tensibai
マニュアルを一読しましたか?おそらくそうではありません。誰もしない。彼らは最初にここに投稿します。 'help(read.csv)'です。具体的には、 'stringsAsFactors'引数です。 –
Hey @RichardScriven - これはcsvからの読み込みに関係しているとは考えていませんでした...しかし、私はあなたの懸念を感謝します:) – user3017075