私はpandasデータフレームからトレーニングとテストセットを作成しようとしています。私は実行すると:Sklearn StratifiedShuffleSplit with pandas
sss = StratifiedShuffleSplit(df['event'], n_iter=3, test_size=0.2)
を私はエラーを取得する:私が得る
df.event.value_counts()
:
irrelevant 5030
event 394
を
ValueError: The least populated class in y has only 1 member, which is too few. The minimum number of labels for any class cannot be less than 2.
私が実行したときしかし、このケースではありません
この問題の原因は何ですか?
警告を再現できません。好奇心の外に、 'len(df)'とは何ですか? –
5424.私はちょうど全く異なるcsvで試してみましたが、うまくいきました。問題を引き起こしているこのdfについて何がわからないのですか? – GNMO11
CSVの空白行のように見えます – GNMO11