2017-08-07 4 views
0

私はcsvファイルを持っており、scikit-learnと一緒に使用するデータセットを作成しようとしています。ローカルcsvファイルからPythonデータセットを作成するにはどうすればいいですか?

これらのパッケージをロード:

import matplotlib.pyplot as plt 
import pandas as pd 
import numpy as np 
from sklearn import datasets, linear_model 

私はこの試みた:

sales = pd.read_csv("sales.csv") 
dataset = np.loadtxt(sales, delimiter=",") 

をそして、それは私に、このエラーが発生しました:

AttributeError: 'DataFrame' object has no attribute 'endswith'

助けてください!私は、csvファイルからデータセットを作成する方法を見つけることができません。

ありがとうございます!明確にするために

EDIT

- 私は私自身のデータを使用する以外、この手順http://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.htmlに従うことをしようとしています。私はそれが可能であれば、csvをPythonデータセットに変換する方法を理解したいと思います。

+0

は、このドキュメントのhttps://docs.scipy.org/doc/numpy-1.10.4/reference/generated/numpy.loadtxt.htmlを参照すると、あなたの 'dtype'を設定するのに役立ちます。 –

答えて

0

基本的に、売上高はすでにデータセットです。あなたはファイル名の代わりにデータフレームオブジェクトを渡そうとしています。あなたはデータの正しい形式を持っているのであれば、あなたはどちらかそれが両方の機能およびラベルや

dataset = np.loadtxt('sales.csv', delimiter=",") 

が含まれていますので、データセットとして直接使用売上どちらにしても、動作しますすることができます。

0

あなたのケースでは、売り上げはおそらくあなたが探しているDataFrameです。たとえば、sales.columnsを印刷してみてください。

+0

私はその問題をどのように解決するのか本当に分かりません。私はそれをして、インデックスとdtypeを表示します。 – adurbin

関連する問題