2017-10-10 4 views
-1

私は​​のチュートリアルをフォローしていました。私はhereから "Export"をクリックしてから "CSV(、)"をクリックしてデータセットをダウンロードしました。python:マシンラーニングマスタリー:時刻データがフォーマットと一致しません

チュートリアル

# load and plot dataset 
from pandas import read_csv 
from pandas import datetime 
from matplotlib import pyplot 
# load dataset 
def parser(x): 
    return datetime.strptime('190'+x, '%Y-%m') 
series = read_csv('shampoo-sales.csv', header=0, parse_dates=[0], index_col=0, squeeze=True, date_parser=parser) 
# summarize first few rows 
print(series.head()) 
# line plot 
series.plot() 
pyplot.show() 

で提案されている次のコードスニペットを使用している場合、私は次のエラーを取得する:

time data '190Sales of shampoo over a three year period' does not match format '%Y-%m' 

私は何ができますか?

答えて

1

はあなたのparser()は、その前に190を入れしようとしている

Sales of shampoo over a three year period

(予想外の)行です上記のエラーが発生しました。

ただからshampoo-sales.csv(削除することを忘れないでください)からプログラムが実行されます。

+0

「時間データ」19001-Janはフォーマット '%Y-%m'と一致しません –

+0

ダウンロードした 'CSV'ファイルを編集している間にファイルの最後)を変更する必要があるので、最初のデータ行を変更する必要があります(したがって、 "1-01"、266.0'の代わりに "01-Jan"、266.0'を取得しました。ファイルの最後にある長いテキストを削除して保存してください(コード内のファイル名に合うように名前を変更してください)。もう一度試してみました。 – MarianD

0

CSVファイルを見ることはできませんが、最初の行と最初の列は「3年間のシャンプーの販売」と思われます。 head()が返すものを見てください。私はそこにヘッダー行があると確信しています。その後、

190Sales of shampoo over a three year period

と提供されたパターン'%Y-%m'ことによってそれを変換し、:あなたのshampoo-sales.csvの終わりに

関連する問題