2017-07-21 6 views
0

Rプログラミングの初心者で、ランダムフォレストのサンプルコードをチュートリアル:Random Forest Using R: Step by Step Tutorialから実行しようとしています。チュートリアルでフォーマットが異なる場合、一方 age.job.marital.education.default.balance.housing.loan.contact.day.month.duration.campaign.pdays.previous.poutcome.ycsvファイルランダムフォレストをRで開きます

names(termCrosssell) 

Iのように結果を取得しています:コードの非常に第二行について 。データファイルを正しく配置していないかどうかを知りたい。第二に、

table(termCrosssell$y)/nrow(termCrosssell) 

のために私は結果を理解することができません

# numeric(0) 

を取得しています。私はデータファイルの配置について調べてみましたが、答えを得ることができませんでした。

+0

csvファイルに間違ったセパレータを指定したように見えます。 'read.table'を使って、フィールドseperator、decimal symbol、qoute、... rightを設定してください。 (スペースとスペキュラのシンボルは名前に点で表示されるので、すべての名前が1つの長い名前に連結された1列の 'data.frame'があるように見えます) – snaut

+0

はい、@snaut。 read.tableはRコードで行う必要がありますか?あなたが言ったように、データファイルには、すべての名前が1つの長い名前に連結された1つの列があります。あなたは後に続くステップを詳しく説明できますか?ありがとうございました。 – Dattaprasad

+0

@jlsが答えにコードを掲載したようです。 – snaut

答えて

2

再現性のあるデータなしで問題を解決するのは難しいです。リンクをたどってデータセットをダウンロードしたが、.csvファイルを開いて名前を変更しなければならなかった。実際、このファイルは ";"セパレータとして。私は正しい結果を得ました:

termcrosssell <- read.csv(file="crosssell.csv", header = T, sep = ";") 
names(termcrosssell) 
[1] "age"  "job"  "marital" "education" "default" "balance" "housing" 
[8] "loan"  "contact" "day"  "month"  "duration" "campaign" "pdays"  
[15] "previous" "poutcome" "y" 
+0

ありがとう@jls。テーブル(termCrosssell $ y)/ nrow(termCrosssell)コマンドの場合、私はまだ数値(0)を取得しています。ソリューションを提案してください。 – Dattaprasad

+0

もう一度、私はあなたの問題は、データの読み方やB.オリジナルの.csvファイルの形式と関係があると思います。 'table(termCrosssell $ y)/ nrow(termCrosssell)'を実行したときに返された: 'no yes 0.88476 0.11524' – jls

+0

本当にありがとう@jls。あなたの答えは私の質問を解決しました。よろしく – Dattaprasad

関連する問題