2
Weka Explorerを使用してのデータをC4.5データファイルとして読み込みたいのですが、C4.5 .dataとC4.5.namesの両方を読み込むときに次のエラーが表示されます。 Wekaデータ読み込みエラー
Weka Explorerを使用してのデータをC4.5データファイルとして読み込みたいのですが、C4.5 .dataとC4.5.namesの両方を読み込むときに次のエラーが表示されます。 Wekaデータ読み込みエラー
C45 names fileが正しいとは思われません。クラスは(ラベルのみ)最初に来ることを
2, 4.
clump: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
size: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
shape: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
adhesion: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
epithelial: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
nuclei: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
chromatin: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
nucleoli: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
mitoses: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
注:このいずれかでbreast-cancer-wisconsin.names
を交換してみてください。ここ
Iは
$ cut -d, -f2-11 breast-cancer-wisconsin.data > breast-cancer-wisconsin.data
を使用して、元のデータセット内の被験者のIDの最初の列を削除しましたが、上記のコードを適合させることは困難ではありません。
代替ソリューション:
は、CSVファイルを生成します。あなただけ*.data
ファイルにヘッダを追加し、*.csv
としてその名前を変更する必要があります。例えば、直接手で*.arff
ファイルを作成し
clump,size,shape,adhesion,epithelial,nuclei,chromatin,nucleoli,mitoses,class
5,1,1,1,2,1,3,1,1,2
5,4,4,5,7,10,3,2,1,2
3,1,1,1,2,2,3,1,1,2
6,8,8,1,3,4,3,7,1,2
...
ようになりますbreast-cancer-wisconsin.csv
とbreast-cancer-wisconsin.data
を置き換えます。変数が少ないので、それほど複雑ではありません。ファイル例はhereです。