11月1日から11月15日まで毎分収集されるデータを含むデータセットがあります。時刻は11/1/2016 00:00:00
で始まり、11/15/2016 23:59:59 I am trying to reshape this dataset, so that each minute is a column, and each day is a row. So
[行1、列1]で終了する列ですwould have the data at 12:00 on 11/1, and
[行2、列1] `は11/2の12時にデータを持ちます。現在、私のデータセット毎日のデータの再整理に問題があります
私は再形状関数を使用しようとしていますが、値をチェックすると正しく一致しません。私のコードでは、myData
の第2列は、私が再形成する必要があるデータであり、それは1日の分数なので、1440列あります。そして15行は、私がデータセットに持つ日数です。
私は間違っている可能性がありますか?
myData = pd.read_csv("Nov1-15.csv")
myData = [myData.iloc[:,2]]
myData = np.asarray(myData)
myData = np.reshape(myData, (1440,15))
myData = np.transpose(myData)
私の配列は、リシェイプした後、現在、以下のようになります。
:私はCSVファイルからそれを読み込み、2番目の列を分離した後array([[ 137., 138., 136., ..., 345., 614., 337.],
[ 137., 137., 138., ..., 340., 611., 337.],
[ 138., 136., 138., ..., 373., 611., 336.],
...,
[ 137., 138., 409., ..., 615., 336., 214.],
[ 136., 136., 412., ..., 614., 334., 214.],
[ 138., 136., 411., ..., 617., 339., 215.]])
は私の元のデータセットは、次のようになります。
[0 137.0
1 137.0
2 138.0
3 137.0
4 136.0
5 138.0
6 137.0
7 141.0
8 137.0
9 139.0
10 136.0
11 136.0
12 137.0
13 136.0
14 138.0
15 138.0
16 137.0
17 136.0
18 138.0
19 137.0
20 137.0
21 138.0
22 138.0
23 137.0
24 135.0
25 138.0
26 138.0
27 138.0
28 136.0
29 136.0
...
21570 614.0
21571 611.0
21572 611.0
21573 611.0
21574 610.0
21575 570.0
21576 346.0
21577 341.0
21578 337.0
21579 337.0
21580 336.0
21581 337.0
21582 336.0
21583 334.0
21584 339.0
21585 337.0
21586 337.0
21587 336.0
21588 238.0
21589 222.0
21590 222.0
21591 220.0
21592 217.0
21593 217.0
21594 214.0
21595 214.0
21596 278.0
21597 214.0
21598 214.0
21599 215.0
サンプルデータ:
11/1/2016 0:00 213
11/1/2016 0:01 214
11/1/2016 0:02 213
11/1/2016 0:03 213
11/1/2016 0:04 210
11/1/2016 0:05 210
11/1/2016 0:06 209
11/1/2016 0:07 209
原産地のサンプル(3〜5行)を投稿できますか? CSVファイルですか?あなたは 'timestamp'カラムを持っていますか? – MaxU
サンプルデータをいくつか追加しました。そして、私はサンプルデータに含まれているような形式のタイムスタンプ列を持っています。 – Gary