2017-12-03 7 views
0

私は最終的にMLを学ぶことに決めました。そうするために、私は市内の公共バイク共有システムの自転車の利用可能性を予測しようとしています。自転車駅の空き状況を予測

  • Dataset(1MB)1台の自転車ステーションです。コラム:日付、曜日、ID、駅、free_bikes、free_docks

私はこのケースでは、私は私の問題のために適切であると考え、多変量時系列予測LSTMのための1つを、機械学習ミステリーのtutorials Kerasとし、次のしてきました。

現在、NNに平日(t-1)、フリーバイク(t-1)、フリーバイク(t)を訓練しています。

損失とval_loss graph私は良いと思う(ish)。もし私が0.9のRMSEと誤解されていなければ、予測をするときにおそらく1台の自転車か1台の自転車があるでしょう。

すべてが正しい場合は、NNにサンプルを取得した日付を伝えたいが、解決できるかどうかわからないいくつかの問題が発生する。私は、ファイルを読み込むときindex_col = 0を言うライン63上の部分を削除します問題に日付を追加するには

ValueError: operands could not be broadcast together with shapes (5949,2) (3,) (5949,2)

:私はこの種のエラーを取得し、余分な列を追加します。

予測を改善するために日付を追加して、それをどのように行うべきですか?

+0

予測するしようとしている列に名前を付けることができますか? – Sniper

+0

列は日付、曜日、ID、駅、フリーバイク、フリー_ドックで、私はfree_bikes(自転車可用性)を予測しようとしています。 – jdmg718

答えて

1

values = values.astype('float32')が浮くようにすべての列を変換するので、すべての列は、フォーマットのような数でなければなりません。 あなたの2列Weekday

values[:, 0] = encoder.fit_transform(values[:, 0])

この行は0番目(最初の)列が整数になり、このラインを使用して整数に変換されます。ここでは、最初の列は日付です。

ソリューション: だけではありません、それはないです

があなたの第二の質問

Is it correct to add the date to improve the prediction and how should it be done?

に答えるために、上記の行今

values[:, 1] = encoder.fit_transform(values[:, 1]) 

後に次の行を追加し整数に第二列に変換。あなたは時間の日付の代わりに素晴らしいだろう月だけを使用することができます

関連する問題