驚くべきことに、私の質問はあまり知られていないことを願っています。GeoDataFrameをSQLデータベースに書き込む
状況によっては、合計で1つ以上のMio観測値を含む複数のcsvファイルがあることがあります。各観測には、とりわけ郵便住所が含まれています。すべてのファイルを単一のGeoDataFrameに読み込み、アドレスをジオコードし、シェイプファイルを指定して空間結合を実行し、各行のポリゴンから情報を保存する予定です。かなり標準的だと思います。これは、1回限りのデータクリーニングプロセスの一部です。
私の目標は、この最終データセットを使用してデータベースをセットアップすることです。これは、データを非常に簡単に共有したり、検索したりできるようにするためです。ウェブサイト上でいくつかの観察をプロットする。また、いくつかの基準に基づいて観測を選択し、いくつかの分析を実行するのは非常に簡単です。
私の問題は、GeoDataFrameをデータベースに挿入する機能がまだ実装されていないと思われることです.GeoPandasはデータベースのサブセットになるはずです(「GeoPandasを使用すると、 PostGISなどの空間データベース」)。
もちろん、各行を繰り返し、各データポイントを「手動で」挿入することもできますが、ここでは最適なソリューションを探しています。任意の回避策については、データ型がデータベースのデータ型と競合する恐れがあります。ここに行くのに "最善の方法"はありますか?
ありがとうございました。
クール!これは、テーブルが存在しない場合の最初の呼び出しで機能します。しかし、連続した呼び出しは 'DataError:(psycopg2.DataError)Geometry SRID(0)がSRID(4326)の列と一致しません。 – j08lue
'psycopg-postgis'にはインスピレーションがあるかもしれません:https://github.com/yohanboniface/psycopg-postgisしかし、 'shapely' /' geopandas'ではなく、独自の型を実装しています。 – j08lue
この '**は' geom'カラムがジオメトリにSRIDを持つことを期待しているので、データを追加するのではなく、1回の呼び出しで動作します。 – j08lue