data-analysis

    0

    1答えて

    約 TBとなるデータの分析を行う必要があります。私はいくつかの時間を探していますが、使用するのはまだ混乱していますか? 私はノードに関するいくつかのポイントに出くわした探しながら、それはあまり計算サービス、数値解析をサポートし、samllerデータに使用することができますを設定します。 本当ですか? 私たちは統計のための複雑なアルゴリズムを設計し、その結果をWebブラウザに表示する必要があります。

    0

    1答えて

    私は初心者のためのパスを構築しています(私のような)Rのデータ分析の学習を通してそれらを導く(Rでお願いします)。 新しいセクションや新しく追加する必要のあるコースを教えてください。助けのためのhttp://studiy.co/path/data-analysis/ 感謝を: 相続人は私が今まで追加されているかどうかです!

    0

    3答えて

    BLOCKQUOTE 私は機械学習の学生や初心者です。私は機能をしたい 列の選択。私のデータセットは50000 X 370であり、それはバイナリの 分類問題です。 最初にstd.deviation = 0の列を削除した後、重複する列を削除した後、ROC曲線の面積が最も大きい20の機能をチェックアウトしました。 PCAを行う次のステップは何でしょうか?誰でも機能の選択に従う一連のステップを与えること

    0

    1答えて

    テーブルに「女性と男性の比率」のような45:55の列があります。 1列の女性(左側は例45)、男性の値は右側(例55)の新しい列に表示されます。 私の問題は、私がPandas(iPythonノートブックを使用)でこれを行う必要があるということです。私はシリーズを使わないソリューションをインターネットで探しています。それは私のためにはうまくいかないようです。助言がありますか? は、ここでその列と行が

    0

    1答えて

    私はPower BIの新機能です。 私は、学生の英語能力テストを含むデータを持っているとしましょう。データの名前はEnglishScoresです。このデータの列はListening,Writing,SpeakingおよびStudentIDsです。私は、と呼ばれる測定値をStudentIDから作成し、それらのグレードに基づいて区別しました(4年生、5年生、6年生)。 学生の成績に基づいて、各ビジュア

    0

    1答えて

    私はcsvファイルを読み込み、それをデータフレームに変換しようとしています。ここでは元の列の列は別として、私は自動的に生成されているインデックスの列を取得しています。 Col1 Col2 Col3 411580 66349 3 0 402645 66887 8 1 388542 82777 4 1 2653

    -1

    1答えて

    私はPythonでデータをビンする方法を理解するのが非常に難しいです。 edges = pylab.hist(data, bins=10)[1] 私はこれが最も理想的な方法であるかどうかわからないんだけど、それが働いた:これまでのところ、私は使用してエッジを取得する方法を働いてきました! 10個のビンを作るために必要な11個の数字のリストを私に与えます。問題は、データをビンに分類する方法として

    0

    1答えて

    x私は2つのフィールドを比較しています。どちらも名目で、1と0だけです。男性と女性、デフォルト、デフォルトなし(さらに多くのデータを同様のフォーマットで表示)それを散布図に入れると、もちろんすべてのシナリオが発生するので、4つの点しか得られませんが、それぞれの場合に何回起こるのかという疑問があります。私はそれをその側にひっくり返して見ることができ、各ドットがこれらの4つのポイントの1つに何回ぶつか

    -1

    1答えて

    一般的で、さまざまな状況のさまざまなデータに適したデータ分析のための強力な技術がいくつか存在しますか? たとえば、新しいデータを分類する必要があります。私はすでにそれが分かっているという分類を持っています。私は(私の思考の例は以下の通りです)しようとする必要があります。 はPCA、その後、RandomForestDecisionsを適用しよう。 次いでようを使用して、すべてのデータにコホネンネット