0

私は現在ビッグデータ解析とウェブ解析を研究していますが、どのように、どこから始めればいいのか分かりません。私はインターネットを見てみましたが、いくつかは私にとって前進しています。このルートに行く前にまず必要なスキル、統計、数学の知識はありますか?ビッグデータとウェブ解析を始めるにあたって

私は現在、平日にアソシエイトソフトウェアエンジニアとして働いており、Rのようなビッグデータに必要なプログラミング言語を実践しているので、週末ごとにオンラインコースに参加する予定です。コンピューターサイエンスの学位をすでに持っています。いくつかの統計的および数学的方法は問題ではない。どんな提案やコメントも大歓迎です!

既に経験をお持ちの方は、どのように経験しており、何を最もうまく活用していますか?

答えて

2

私はあなたと同じボートにいます。私はビジネスアナリストとしてWeb開発部門で働いています。私はソフトウェア開発、データマイニング、データの視覚化を行っていますが、私は常に興味深いスキルを向上させています。

Web解析/ビッグデータ
あなたは、彼らがウェブサイトを持っていると仮定すると、あなたの会社のGoogle Analyticsアカウントへの読み取りアクセスを得ることができるかどうかを参照してください。 APIは本当に良いですし、Rのあらかじめ構築されたパッケージは、大量のデータを簡単に取り出せるようにします。ウェブサイトが十分な大きさであれば、実際のデータセットを簡単に作成できます。これらはおそらく "ビッグデータ"のように "ビッグ"ではありませんが、データビジュアライゼーションの実践には間違いありません。 ShinyとR Markdownを学ぶことをお勧めします。あなたの会社と共有できるWeb統計のビジュアライゼーションを簡単に作成できます。処理しようとしているデータの量に問題が発生した場合(つまり、膨大なWebが存在する場合)、大きなデータを処理するためにSparkを調べることができます。 Courseraは、ビッグデータに特化した専門化を行っています - https://www.coursera.org/specializations/big-data。あなたはそれらを単に「監査」するだけで、すべてのクラスを無料で受けることができます。あなたは証明書や何かを取得することはありませんが、すべての教材にアクセスできます。彼らは明らかにSpark、Hadoop、Pig、Hiveを通過します。私はそれを取っていませんが、私が取ったUCSDコースラのクラスはかなり良いです。

明らかにCourseraはすべてではありません... edx.org、Pluralsight、Udemyなどもチェックしてください。あなたは1年間無料のPluralsightメンバーシップを手に入れることができます。私はMicrosoftを何とかしていた。 Pluralsightの私の好きなコースは(データ/分析とは無関係)Ethical Hackingです。 Udemyは、HUGEコースに関する驚異的な取引をしばしばしています。データ分析やそのようなもののためのPythonに関する講義の21時間などです。サービスにサインアップするだけで、1〜2週間で「特別オファー」を受けることができます。彼らは通常$ 10-20です。 https://www.brighttalk.com/は、データサイエンス/アナリティクスに関するウェビナーや講演にも適しています。

データベース
私の会社では、SQL Server(Microsoft)を使用していますので、私はまた、MVA(Microsoft仮想アカデミー)にいくつかのデータベースクラスを取りました。彼らは、完全なノブからスキルを磨くまでの一連のクラスを持っています:MVA Database Stuff

データセット
大きなデータセットが必要な場合は、Kaggleに参加してください。彼らは機械学習のためにすばらしいデータセットを持っていることがよくありますが、自分でそれを使って視覚化することができます。私は、特にラベル付けされたデータセットを探すだろう。より大きなセットの多くは、完全に匿名化されています。ラベルはありません。しかし、ちょうど掘り出しているのであれば、それはあまり面白くない。さらに、誰かが公開データソースの集まりをここに集めています:https://github.com/caesar0301/awesome-public-datasets。最後に、NYC Open Dataはネットデータセットを取得するための私の好きな場所の一つです。いくつかは非常に退屈ですが、いくつかのクールな分析がありますdone on parking ticketsと同様です。あなただけの、読みhttps://www.metacademy.org/をチェックアウトするより取るためのクラスや書籍を探しているなら

もっと...
。彼らは、深い学習、機械学習、ベイジアン統計、およびそのような他のものを学ぶためのいくつかの提案されたパスを持っています。私は、機械学習は優れた次のステップだと考えています。ソフトウェア開発、データベース管理/作成/照会、視覚化に精通していると思います。

さらに...
自分自身を浸してください。データブログ、ポッドキャスト、ミートアップグループ、会議、ニュースなどがたくさんあります。あなたがそこに入り、何が起こっているのか、誰が何をしているのかを理解することができます。それはとにかく面白いスーパーです。私が従う私の好きなもののうちの2つ:datatau(データ科学のためのハッカーのニュース)とI Quant NY(上記の駐車券のリンク)。

+1

この詳細情報をありがとうございました。あなたはこのキャリアに完全移行するために、私が教室のコースやブートキャンプに参加する必要があると思いますか?私はこれが何とか高価なので、これに出席することは難しいと思うが、それでも、ありがとう! – Vaanz

+0

私はこれらのブートキャンプから、完成後の配置率について、本当に印象的な統計をいくつか見てきました。しかし、マシンラーニング、データサイエンス、データ分析に関するマネージャーを雇うことから、私はあらゆることが経験よりも優れていると言います。それは、あなた自身のデータを掘り下げ、落とし穴などを学ぶことを意味します。あなたは、分析についてどのように行ったか、どこが間違っていたか、結果を説明するためのステップごとの詳細をブログに残すべきです。これはまた、データ科学のコミュニケーションにもつながります。これは、あなたが結果を敷地内の人々に定期的に提示するため、非常に重要です。 – doctaj

関連する問題