13

Twitter、Google、Amazon、del.icio.usなどはすべて、無料ですべてのデータを再生できます。また、Project Gutenbergのようなイニシアチブを通じて利用可能な多くのテキストデータがあります。そして、それはちょうど氷山の先端です。大量のデータを楽しむいくつかの方法はありますか? (Twitter、del.icio.usなどのAPI)

私はこのデータをどのように楽しく使用することができるのだろうかと思いました。私は初学年のIT学生ですから、統計、機械学習、協調フィルタリングなどの知識はありません。この分野への関心は本書でまとめられています。Tobu Segaranの Programming Intelligenceあなたがデータでできることをより深く見てください。私はどこから始めるべきかわかりません。何か案は?

また、私が行って買うべきかどうかを熟考しています。人工知能プログラミングのパラダイム。街を旅する価値がありますか?

+0

Amazonは本を販売しています:)なぜ街を旅するのですか? –

+0

インドで本を売っていない:( –

答えて

6

Guttenbergからマルコフチェーンジェネレーターを介してさまざまなスタイルの書籍を発射してみてください - あなたにはPerl hereのものがあります。

+0

マルコフ機械は楽しいです:) –

+0

その結果をTwitterのアカウントに投稿し、あなたのマシンで生成されたツイートに基づいて何人のフォロワーを得ることができるかを見てください。 –

+1

私はそれが好きです!しかし、ほとんどのtwitsは、とにかくプログラムの悪いAIだと思われます。私はチューリング・テストに合格する能力に重大な疑念を抱いています。 –

3

視覚化して、それらを共有してください。

0

ハングマンゲームのようなパズルを作ることができます。またはマッシュアップするか、情報に参加するためにYahooパイプを試してみてください。

1

http://www.netflixprize.com/ Netflixは匿名化されたデータセットを提供しており、お客様の選択肢を予測するためのより良いアルゴリズムを求めています。

+0

私はこれを提案するつもりでした。私はこれを今作業中です。 –

0

将来の株式市場のトレンドを予測します。利益!

+0

簡単に言った。 – Cerin

1

もしあなたがPythonに慣れているなら、nltkで遊んでみてください。テキストマイニングや一般的な機械学習のための数多くの図書館があります。 nltk bookまで進んでください。

1

簡単なAI問題から始める場合は、クラスタリングを試してみてください。

http://en.wikipedia.org/wiki/Data_clustering

あなたは、タグまたはそのようなクールなもので、グループFlickrの画像にそれを一緒に使用することができます。

関連する問題