このクエリは問題ありませんが、データを取得する時間を変更すると、以下のエラーが発生します(200,000行以上)。私はそれが問題である照会またはフィル/リサンプル操作であるかどうかはわかりません。私はクラスター内に1台のマシンしか持っていません。Cassandra datastaxドライバが大きすぎるクエリでタイムアウトする
rsltES = session.execute("""SELECT * FROM tickdata.timeseries
WHERE
curve = 0
AND symbol = 1000
AND time > '2016-05-23T08:00:00-0400'
AND time < '2016-05-25T19:00:00-0400'
order by time
allow filtering;""")
dfes = dfes.set_index(['time'])
dfes.index.tz_localize('US/Eastern')
df_ohlcES = dfes.resample('5Min').ohlc()
df_ohlcES = df_ohlcES.ffill()
df_ohlcES['DateTime'] = np.arange(len(df_ohlcES))
# Move the DateTime Column to the Front
colsES = df_ohlcES.columns
colsES = colsES[-1:] | colsES[:-1]
df_ohlcES = df_ohlcES[colsES]
クエリが多すぎるデータを返すと、クエリがタイムアウトします。タイムアウトを増やす方法はありますか?
Traceback (most recent call last):
File "pandascas.py", line 36, in <module>
allow filtering;""")
File "cassandra/cluster.py", line 1647, in cassandra.cluster.Session.execute (cassandra/cluster.c:28041)
File "cassandra/cluster.py", line 3243, in cassandra.cluster.ResponseFuture.result (cassandra/cluster.c:61954)
cassandra.ReadTimeout: code=1200 [Coordinator node timed out waiting for replica nodes' responses] message="Operation timed out - received only 0 responses." info={'received_responses': 0, 'required_responses': 1, 'consistency': 'LOCAL_ONE'}