2016-10-29 2 views
0

私は現在、差分プライバシーのアプリケーションのプロジェクトを進めており、UCIマシン学習リポジトリにあるデータを試してみたいと思います。UCIマシンラーニングレポジトリのデータセットの使用方法

私の問題は、MySQL、PostgreSQL、さらにはnosqlのようなデータベースエンジンにデータセットをエクスポートする際に、この種のリポジトリを使用することは新しいことです。

私の質問は、この種のリポジトリからのデータセットをデータベースエンジンに使用する方法です。私はこのデータを使用する予定です

https://archive.ics.uci.edu/ml/datasets/Communities+and+Crime

+0

使用する予定の実際のデータベースに質問を記入し、使用するデータのスナップショットを含めてください。 –

+0

@TimBiegeleisen MySQLデータベースを使いたい – fudu

答えて

1

免責事項を設定します。私はどちらか、この経験がありません。

とタグ付けされているので、私はその答えを示しますが、も同様です。

これはCSVファイルのように見えるので、指定された列(@attribute)でテーブル(@relation)を作成できます。それぞれの列を見て、適切なタイプを確認する必要があります。数値はintegerまたはnumeric/decimalタイプ、文字列はcharまたはvarcharタイプです。

create table crimepredict (
    state int, 
    county int, 
    community int, 
    communityname varchar(255), 
    fold int, 
    population decimal(3,2), 
    ... 
) 

そして、あなたはCOPYコマンド

copy crimepredict from '/path/to/communities.data' null '?' delimiter ',' quote '' format csv; 

でファイルをインポートすることができますquote ''作品かどうかは、わかりません。そうでない場合、インポートする前にデータファイルを準備し、コミュニティ名を二重引用符で囲む必要があります。

関連する問題