2012-01-21 132 views
2

Weka Explorerを使用してのデータをC4.5データファイルとして読み込みたいのですが、C4.5 .dataとC4.5.namesの両方を読み込むときに次のエラーが表示されます。 enter image description here enter image description hereWekaデータ読み込みエラー

答えて

5

C45 names fileが正しいとは思われません。クラスは(ラベルのみ)最初に来ることを

2, 4. 
clump: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. 
size: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. 
shape: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. 
adhesion: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. 
epithelial: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. 
nuclei: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. 
chromatin: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. 
nucleoli: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. 
mitoses: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. 

注:このいずれかでbreast-cancer-wisconsin.namesを交換してみてください。ここ

Iは

$ cut -d, -f2-11 breast-cancer-wisconsin.data > breast-cancer-wisconsin.data 

を使用して、元のデータセット内の被験者のIDの最初の列を削除しましたが、上記のコードを適合させることは困難ではありません。

代替ソリューション:

  1. は、CSVファイルを生成します。あなただけ*.dataファイルにヘッダを追加し、*.csvとしてその名前を変更する必要があります。例えば、直接手で*.arffファイルを作成し

    clump,size,shape,adhesion,epithelial,nuclei,chromatin,nucleoli,mitoses,class 
    5,1,1,1,2,1,3,1,1,2 
    5,4,4,5,7,10,3,2,1,2 
    3,1,1,1,2,2,3,1,1,2 
    6,8,8,1,3,4,3,7,1,2 
    ... 
    
    よう
  2. になりますbreast-cancer-wisconsin.csvbreast-cancer-wisconsin.dataを置き換えます。変数が少ないので、それほど複雑ではありません。ファイル例はhereです。

関連する問題