2016-03-21 15 views
0

時系列予測モデルを構築する必要があり、私が持っているのは、ユーザーがサイトにログインするときのタイムスタンプのシーケンスです。どのようにモデリングしますか。ウェブログインタイムスタンプの時系列予測

ここにデータの最初の数行があります。私はこれをパンダシリーズとして持っています。今

0 2012-03-01 00:05:55 
1 2012-03-01 00:06:23 
2 2012-03-01 00:06:52 
3 2012-03-01 00:11:23 
4 2012-03-01 00:12:47 
5 2012-03-01 00:12:54 
6 2012-03-01 00:16:14 
7 2012-03-01 00:17:31 
8 2012-03-01 00:21:23 
9 2012-03-01 00:21:26 

質問のカップル:

1)。私が持っているすべてがタイムスタンプで、Y値やその他の機能がないときに、時間ごとにユーザー行動をグラフ化する方法

2)。この時系列に合ったモデルを作成し、次の2週間予測します。

他の機能や変数はありません。毎日3ヶ月のようにログインするだけです。

答えて

0

パート1に対応して、私は同様のことをして、同じ問題に遭遇しました。エポックを使って時系列をグループ化し、それを辞書にロードしました。そこから私は時系列の時系列で作業することができました。 (データソースはjsonです)次に、それをpanda DataFrameに変換し、matplotlibを使って直接グラフを作成することができます。あなたのデータはすでにパンダに入っているので、データを抜かれて初期ループを編集して生データを処理することができます。私はこれが役立つことを願っています

for key in responseJson['All'].keys(): 
     t = time.strftime('%Y,%m,%d %H:00:00', time.gmtime(float(key)/1000.0)) 
     h = responseJson['All'][key] 
     word = t 
     epochkey = int(time.mktime(time.strptime(t, '%Y,%m,%d %H:00:00'))) 

     if word not in dict: 
      dict[word] = h 
      epochdict[epochkey] = h 
     else: 
      dict[word] += h 
      epochdict[epochkey] += h 

は、その後、私はパンダのデータフレームに変換:

for row in epochdict: 
     if(row[0] not in data): 
      data[row[0]]={} 
     data[str(row[0])][str(row[2])]=round(row[3],3) 

      df=DataFrame(data).T.fillna(0) 

これは私が時系列に基づいて時間単位のデータをプロットすることができました。

関連する問題