scikit-learn

    0

    1答えて

    私はk倍のクロスバリデーションで最良のモデルが選択される関数を書いています。 が は、決定木の回帰 のために最適なパラメータのために求めてデータをスケーリングすることを関数内、私はその後、私はいくつかの目標値を予測するモデルを使用するパイプラインを持っています。そのためには、グリッド検索中に適用されていたのと同じスケーリングを適用する必要があります。 列車データに同じフィットを使用して、ターゲット

    0

    1答えて

    を学ぶ使用してターゲットラベルを予測するために、どのように、私は...このインスタンスで発生 data = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD')) target = "A" を... ...おもちゃの例を提供します A B C D 0 75 38 81 58 1

    0

    1答えて

    Python PandasでFeature Hashingを使用すると少し失われます。 私は、さまざまな種類の多くの情報を持つ複数の列を持つDataFrameを持っています。データのクラスを表す1つの列があります。 例: col1 col2 colType 1 1 2 'A' 2 1 1 'B' 3 2 4 'C' 私の目標は、機械学習アルゴ

    0

    2答えて

    sklearn Gaussian混合モデルアルゴリズム(GMM)を使用してデータ(75000、3)をクラスタ化しました。私は4つのクラスタを持っています。私のデータの各点は、分子構造を表しています。今私はクラスターの重心であると理解している各クラスターの最も代表的な分子構造を得たいと思います。これまでのところ、gmm.means_属性を使用してクラスターの中心にあるポイント(構造体)を特定しようと

    0

    1答えて

    ロジスティックモデルを訓練し、相互検証し、joblibモジュールを使用してファイルに保存しました。今私はこのモデルを読み込み、それを使って新しいデータを予測したいと思います。 これは正しい方法ですか?特に標準化。私も新しいデータにscaler.fit()を使うべきですか?私が従ったチュートリアルでは、scaler.fitはトレーニングセットでのみ使用されていたので、ここで少し失われています。ここで

    -1

    1答えて

    データセットに純粋なガウス分布を近づけようとしています。これはdefault_next_monthは、ターゲット変数である LIMIT_BAL SEX EDUCATION MARRIAGE AGE PAY_0 PAY_2 PAY_3 PAY_4 PAY_5 ... BILL_AMT4 BILL_AMT5 BILL_AMT6 PAY_AMT1 PAY_AMT2 PAY_AMT3 PAY_AMT

    -1

    1答えて

    私は4列のデータを持っています。これらのXでは、3つのクラスタセンターをランダムに選び、最小のSSEを持つクラスタを探す必要があります。中心と慣性(SSE)が、さまざまなランダム状態で同じであることが判明しているのはなぜですか?init = random parameter? Xvar=stud.iloc[:,1:5] #X1=np.random.randint(22,99,size=

    2

    1答えて

    sample_weightの場合、その形状の要件は配列のような形状(n_samples、)であり、配列のような形状[n_samples]です。 (n_samples、)は1次元配列を意味しますか? [n_samples]はリストを意味しますか?それとも、彼らは互いに同等ですか? どちらの形式をここで見ることができます:http://scikit-learn.org/stable/modules/g

    0

    1答えて

    Sklearn pageで説明されているように、私のカウントベクトルにlemmatizationを追加しました。 fit_transformを使用してDTMを作成するときに from nltk import word_tokenize from nltk.stem import WordNetLemmatizer class LemmaTokenizer(object): def

    0

    2答えて

    データセット「桁」があります。データセットには1797個の小さな画像(8×8ピクセル)が含まれ、それぞれに手書きの数字(0〜9)が含まれています。各画像は、ピクセルをフィーチャとして持つデータサンプルと見なされます。したがって、フィーチャテーブルを作成するには、各8x8イメージを64個のフィーチャカラムを持つフィーチャマトリックスの行に変換する必要があります。どのようにそれのための特徴行列とラベル