機械学習アルゴリズムを選択する前にデータ探索を行う方法

-7

すべてのツールがデータ分布パターンを認識し、MLアルゴリズムを選択するのに役立つでしょうか？機械学習アルゴリズムを選択する前にデータ探索を行う方法

2017-01-09 Grant

まず、機械学習をフィールドとして理解し、そのサブフィールドをある程度理解しておく必要があります。あなたのツールを直感的に理解していないと、そのツールをいつ使用するのかを特定できません。

あなたが話しているアイデアは、探索的データ分析と呼ばれ、正しい方法について考えると非常に親しみやすいものです。

まず、データとそのドキュメントを調べてください。

次に、存在する可能性のあるパターンについていくつかの仮説を立ててください。

MLの理解に基づいて、あなたの仮説についていくつかの洞察を与えるかもしれないいくつかのアプローチを考えてみましょう。たとえば、提案された従属値が複数の異なる値を持つ場合、分類に問題があり、入力データに基づいて適切な方法を選択する必要があります。

便利なツールがたくさんありますが、プログラミング言語RやPythonが良いスタートになります。どちらも非常に強力なデータサイエンスツールです。 Rはより大きな学習曲線を持っていますが、データサイエンスを念頭に置いて構築されています。一方、Pythonは、ピックアップするのが非常に簡単ですが、MLやデータサイエンスライブラリに関して、より多くの選択肢があります。 Pythonでは、CSVとデータ操作についてはPandas、データ解析とMLについてはTensorflow、TheanoまたはScikit-Learnを参照してください。

希望すると便利です。

出典

2017-01-10 21:07:00

ありがとうございます！私はApache Zeppelinについて調査します – Grant

機械学習アルゴリズムを選択する前にデータ探索を行う方法

答えて

関連する問題