data-analysis

0熱

1答えて

約 TBとなるデータの分析を行う必要があります。私はいくつかの時間を探していますが、使用するのはまだ混乱していますか？私はノードに関するいくつかのポイントに出くわした探しながら、それはあまり計算サービス、数値解析をサポートし、samllerデータに使用することができますを設定します。本当ですか？私たちは統計のための複雑なアルゴリズムを設計し、その結果をWebブラウザに表示する必要があります。

0熱

1答えて

パス：Rのデータ分析R

私は初心者のためのパスを構築しています（私のような）Rのデータ分析の学習を通してそれらを導く（Rでお願いします）。新しいセクションや新しく追加する必要のあるコースを教えてください。助けのためのhttp://studiy.co/path/data-analysis/ 感謝を：相続人は私が今まで追加されているかどうかです！

0熱

3答えて

機能選択のテクニックに関する提案？

BLOCKQUOTE 私は機械学習の学生や初心者です。私は機能をしたい列の選択。私のデータセットは50000 X 370であり、それはバイナリの分類問題です。最初にstd.deviation = 0の列を削除した後、重複する列を削除した後、ROC曲線の面積が最も大きい20の機能をチェックアウトしました。 PCAを行う次のステップは何でしょうか？誰でも機能の選択に従う一連のステップを与えること

0熱

1答えて

パンダのシリーズを使わずにデータを分析する際の値「比率」を扱う方法

テーブルに「女性と男性の比率」のような45:55の列があります。 1列の女性（左側は例45）、男性の値は右側（例55）の新しい列に表示されます。私の問題は、私がPandas（iPythonノートブックを使用）でこれを行う必要があるということです。私はシリーズを使わないソリューションをインターネットで探しています。それは私のためにはうまくいかないようです。助言がありますか？は、ここでその列と行が

0熱

1答えて

PowerBIで異なる視覚化のための異なるスライサー

私はPower BIの新機能です。私は、学生の英語能力テストを含むデータを持っているとしましょう。データの名前はEnglishScoresです。このデータの列はListening,Writing,SpeakingおよびStudentIDsです。私は、と呼ばれる測定値をStudentIDから作成し、それらのグレードに基づいて区別しました（4年生、5年生、6年生）。学生の成績に基づいて、各ビジュア

0熱

1答えて

Python：Python 3を使用してデータフレームのデフォルトインデックスを取り除く方法

私はcsvファイルを読み込み、それをデータフレームに変換しようとしています。ここでは元の列の列は別として、私は自動的に生成されているインデックスの列を取得しています。 Col1 Col2 Col3 411580 66349 3 0 402645 66887 8 1 388542 82777 4 1 2653

-1熱

1答えて

Pythonのビニングデータ

私はPythonでデータをビンする方法を理解するのが非常に難しいです。 edges = pylab.hist(data, bins=10)[1] 私はこれが最も理想的な方法であるかどうかわからないんだけど、それが働いた：これまでのところ、私は使用してエッジを取得する方法を働いてきました！ 10個のビンを作るために必要な11個の数字のリストを私に与えます。問題は、データをビンに分類する方法として

0熱

1答えて

matplotlibに周波数を含めることで、2次元散布図を3dにすることはできますか？

x私は2つのフィールドを比較しています。どちらも名目で、1と0だけです。男性と女性、デフォルト、デフォルトなし（さらに多くのデータを同様のフォーマットで表示）それを散布図に入れると、もちろんすべてのシナリオが発生するので、4つの点しか得られませんが、それぞれの場合に何回起こるのかという疑問があります。私はそれをその側にひっくり返して見ることができ、各ドットがこれらの4つのポイントの1つに何回ぶつか

-1熱

1答えて

最高のデータミン/分類技術

一般的で、さまざまな状況のさまざまなデータに適したデータ分析のための強力な技術がいくつか存在しますか？たとえば、新しいデータを分類する必要があります。私はすでにそれが分かっているという分類を持っています。私は（私の思考の例は以下の通りです）しようとする必要があります。はPCA、その後、RandomForestDecisionsを適用しよう。次いでようを使用して、すべてのデータにコホネンネット