私は数十万、多分何百万行ものデータで、おそらくは50以上の列のエントリを持つPythonでいくつかの仕事をしているかもしれません。私はこのデータを追跡し、それを処理する方法を欲しがっています。私もMicrosoft Accessを学びたいので、そこにデータを入れることをお勧めします。これを行う簡単な方法はありますか?私もSASを学びたいので、それもうまくいくでしょう。あるいは、私はそのような状況について知っておくべき他のプログラム/方法がありますか?PythonのデータをAccessファイルに保存することはできますか?
ありがとうございました!
私はさまざまなクエリを使用してデータを処理します。ポイントは、私はデータをAccessに入れてからAccessを使って処理します。そして、私はいくつかのVBAを使用するかもしれません。私はExcel用のVBAを知っており、Accessのためにそれを学びたいと思っています。しかし、あなたが言及しているように、おそらく本当に遅いでしょう。だから私はSASも考えました。私はそれほどよく分かりませんが、大量のデータを扱うのは良いと聞いています。そして、私はこれらのプログラムにデータをどのように入れるのかという非常に基本的な考えを私に与えてくれますか? – Graphth
アクセスがうまくいくかもしれませんが、それはしばしば成立しているほど悪くありません。Pythonでデータベース接続を使用するのと同じ方法で使用します。Pythonモジュール(pyodbcなど)をインポートします。接続オブジェクトを作成します(ODBCドライバとデータベースファイルを指定する文字列を渡します)。接続オブジェクトからカーソルオブジェクトを作成し、カーソルオブジェクトを使用してデータベース上でSQLパラメータ化されたSQL文を実行します。 –
「リレーショナルタスク」に関連するAccessパフォーマンスに関する問題はよくわかりません。これは、私が過去15年間にJet/ACEで経験した現実には合致しません。 JOINはすべてのデータベース(特にOUTER結合)で比較的高価です。そのため、私はそれを多くの問題とは見なしません。何千もの行がAccessでうまくいきます。何百万もの問題があるかもしれませんが、ファイルサイズが2GBという厳しい制限のためにパフォーマンスがあまり高くないためではありません。しかし、実際には表の行のサイズに依存します。私は700万行以上のテストデータベースを持っています。 –