私はpythonとsklearnを使って機械学習を読んできました。 私は虹彩のデータセットで練習しようとしましたが、次にUCIのウェブサイト上の他のデータセットを見つけるために続けました。pandasにテキストを含む適切な区切り文字を定義するcsv_read
"Amazon Book Reviews"と呼ばれるものが見つかりました。
ドキュメントには、各エントリが新しい行で区切られ、4つの属性のそれぞれが空白で区切られていることが示されています。
タイトル(テキスト)と説明(HTML)があるため、残念ながらデータにはスペースが含まれています。私がしようとすると当然のパンダcsv_read機能を使用する場合
それはどこの列を分離し、どちらもI.
任意のアイデアを行うことを知りませんか?初心者の機械学習(そして一般的なプログラミング)のために私は自分の深みから離れすぎていますか?
母私はそれを見ることができるはずだったように感じる。それを見ていただきありがとうございます。 – DataBrown