私はmongodbデータベースに膨大なデータを持っており、最小値、最大値、平均などのデータ分布を把握したいと考えています。私の問題は、データ型が整数ではなく文字列か浮動小数点であるため、データをソートできず、平均などを計算できないということです。 データ型をパイプライン内で浮動小数点型に変換する方法はありますか? たとえば、文字列の日付を日付型に変換するには、$dateFromString(aggregation)mongodbとpythonで文字列を浮動小数点に変換する
などがあります。
私はmongodbデータベースに膨大なデータを持っており、最小値、最大値、平均などのデータ分布を把握したいと考えています。私の問題は、データ型が整数ではなく文字列か浮動小数点であるため、データをソートできず、平均などを計算できないということです。 データ型をパイプライン内で浮動小数点型に変換する方法はありますか? たとえば、文字列の日付を日付型に変換するには、$dateFromString(aggregation)mongodbとpythonで文字列を浮動小数点に変換する
などがあります。
MongoDBはJavascript、iircに基づいているため、関数 'parseFloat'を使用して、別のデータ型をfloatに変換しようとすることができます。必要な場合に備えて整数に変換しようとする 'parseInt'もあります。
ありがとうございます。しかし、私はPythonで動作します。出来ますか? 私はちょうど最小値または最大値を探したいので、私はすべてのデータを見つけたくないので、私のデータが巨大なので時間がかかりますので、それらを一つずつ解析します。しかし、可能な方法がない場合は試してみます – dede
Pythonでは、何かをfloatに変換する同等の関数は 'float'です。この場合、最小値または最大値を見つけられなかったので、すべてを調べていない限り、最小値と最大値を見つけるためにすべてのデータを解析する必要があります。 [$ group](https://docs.mongodb.com/manual/reference/operator/aggregation/group/#pipe._S_group)演算子を使用してMongoDBクエリでmin/max/avgを見つけることもできますPythonでそのような作業をする必要はありません。 –
このような機能はパイプラインでは提供されていません。詳細は、 [ここ](https://jira.mongodb.org/browse/SERVER-11400)を参照してください。集計を実行する前に、それらを変換し、予想されるタイプのdbに保存する必要があります。 – Veeram
Veeramありがとうございます。残念ながらそれを知るためには、まずデータ型を変更する必要があります。 – dede