2011-12-24 8 views
8

。私はデータを「オープンソース」する最良の方法を探しています。(コードではなく)ソースデータを開く最も良い方法は何ですか?私はおそらく他の誰か1日に使用のものであってもよい内容がデータベースを、コンパイル済みの最近のプログラミングプロジェクトの一環として

SQLをGitHubにアップロードすることはできましたが、誰かがもっとデータ集約的な共有方法を見つけたら疑問に思っていました。おそらくユーザーがブラウジング/照会/視覚化を容易にするウェブサイト/データセットを向上させることができます。明確にするために

、私は私がデータを共有することができる場所ではなく、それを共有する形式を探しています - 理想的にはGitHub/Sourceforgeのデータ・セットと同等。

データ(SQLの数千行)が比較的小さいので、ボリュームが障害であってはなりません。

+1

データの主題は何ですか? – Paul

+0

データセットはどれくらいですか?ユーザーは合理的にそれをすばやくダウンロードできますか? –

答えて

2

私はこのようなもののためにAmazon's S3の大きなファンです。あなたのデータセットが十分興味深い場合は、InfoChimpsで公開することもできます。

+0

セカンド - InfoChimpsによって提供されるインフラストラクチャにより、自己配布よりもはるかに簡単なルートになります。自分で配布する場合、S3は良いホスティングオプションを提供します。 – Iterator

0

あなたは、おそらく最も互換性のあるデータ形式であること、それはかなり冗長ですが、ことを、XMLにエクスポートすることができます。もう1つの解決策はODataですが、これは望ましくないかもしれないデータを提供するデータとプラットフォームをホストすることを意味します。

1

私は別の企業からの大量のデータできました。ほとんどの場合、このデータはテキスト区切りのデータ形式です。最も一般的なのはコンマ区切りまたはタブです。 MySQLはCSVをエクスポートしてインポートすることができるので、コンマを使用するのが良い選択です。重点は(私はそれを使用していないので、これは不公平かもしれない)の可視化にあるように見えますが、

id, first_name, last_name, address 
1, John, Smith, 11222 Stree Name 
1

Google Fusion Tablesは、これらのボックスの一部を刻み:ここでは一例です。私はまた、消えていく習慣があるため、最近の第二層Google製品にあまりにも多大な負担を払うことには消極的です。

0

Sparkfunは、主にリアルタイムのデータソースをターゲットにしているようですが、無料のストレージを提供しており、プラットフォームはオープンソースなので、独自のサーバーをホストすることができます。

関連する問題