私はtabledata.csv
ファイルを持っています。私はpandas.read_csv
を使って、特定の条件で特定の列を読んだり選択したりしています。IPythonノートブックでのCSVファイルのSQL文
例えば、次のコードを使用して、すべての「名前」を選択します。session_id =1
は、datascientistworkbenchのIPython Notebookで問題なく動作しています。私はcsvファイルを読んだ後
df = pandas.read_csv('/resources/data/findhelp/tabledata.csv')
df['name'][df['session_id']==1]
私は疑問に思う、それは何らかの形でSQLデータベースとして、それを「スイッチ/読み」することが可能です。 (私はかなり正しい言葉を使ってそれをうまく説明していないと確信しています、それについて残念です!)。しかし、私が望むのは、特定の条件を持つ特定の行を選択するために、IPythonノートブックでSQLステートメントを使用したいということです。私のようなものを使用でき同様:
Select `name`, count(distinct `session_id`) from tabledata where `session_id` like "100.1%" group by `session_id` order by `session_id`
をしかし、私は推測する私は、SQLステートメントを使用することができるように、別のバージョンにcsvファイルを変更する方法を把握する必要があります。多くのthx!
異なるフォーマット間でデータを簡単に移動できる[Odo](http://odo.readthedocs.org/en/latest/)(例えば、csvをSQLデータベースにロードすることができます)。 –
これは、パンダとSQLの比較方法を紹介したものです。その間、 – measureallthethings
もできます。df.head()または使用しているデータの例を提供することは可能でしょうか? – measureallthethings