data-science

    0

    1答えて

    に不一致を予測する私はMLとsklearnに比較的新しいですし、私は6つの別の特徴は、正則化パラメータの異なる値でlinear_model.Lassoを使用して、入力データのための線形モデルを訓練しようとしています。私はこれらの2式を実行することによって、異なる値を得続ける理由XとYがモデルのための私の入力パラメータであることを考えると、私は理解することはできません。 sum(model.coef

    0

    0答えて

    これで何も見つかりませんでしたので、ここで私の質問が答えを見つけることを願っています。設定 問題: すべてはブルームフィルタで採掘を高揚するために属します。 は私が今までどの段階でどのような場合にはMに達しない場合Nのために、いくつかの最大容量Mと各フィルタN. 内の項目の金額をブルームフィルタの数千を持っています。 偽陽性Pの 確率 - 0.001%私は漸進5つのインクリメンタル交差点を±して、

    0

    4答えて

    私はパンダのドキュメントと料理のレシピを検索しました。それは、dataframe.columnName.round(decimalplace)を使って簡単に最も近い小数点以下に丸めることができます。 これをどのように大きな数値で行うのですか? 例では、私は住宅価格の列を持っており、それらを最も近い10000または1000などに丸めたいと思います。 dataframe.columnName.roun

    0

    1答えて

    私はpythonのsklearnを使って因子分析を実行するのに苦労しています。 Rで 次のコードを実行した後: Call: factanal(x = data_final, factors = 2, scores = "regression", rotation = "varimax", lower = 0.01) Uniquenesses: WTI GOLD CAC40 DAX EU

    0

    2答えて

    私は多数のユーザ(数十万人)からの位置データを持っています。私は現在の位置といくつかの履歴データポイント(1時間後の分データ)を保存します。 誕生日パーティーなどの自然なイベントの周りに集まっている人を検出するにはどうすればいいですか?小規模の人でも(5人から始めると言わせてください)、検出されるはずです。 このアルゴリズムは、ほとんどの場合リアルタイムで(または少なくとも1分に1回)動作して、群

    0

    1答えて

    この関数を使用してPythonで分類器を検索する場合、GridSearchCV()は、フォーム1〜100を調整するパラメータの間隔を想像してください(1:100は機能しません) ??

    0

    1答えて

    私はデータ科学に新しいので、データ間の関係を探求したいと思います。556784 X 60行と列を含む非常に大きなデータセットがあります。ニューラルネットワークに供給するために無視する必要のない変数がいくつかあります。 線形回帰& &複数の回帰を使用すると、XlabelとYlabelの関係を見つけるのに役立ちます。しかし、このような巨大なデータセットで回帰法を実行することは本当に役に立ちますか?また

    -1

    1答えて

    私はいくつかの広告出版社のデータセットを持っています。サイト運営者は広告のクリックごとに収益を得る。データセットは、サイト運営者リストとそれに対応するクリック数および取引数から構成されます。問題は、出版社が不正行為をしてクリックすると、より多くのお金を得るために自分の広告を表示するかどうかです。これらのサイト運営者の一部はクリック数が非常に少ない(10未満)ため、取引件数は0件です。 私はこれらの

    1

    1答えて

    私は巨大なデータセット(2653,17)を持っています。私は、value_countsメソッドから推測しているように、2つの列が多少関連しているが正確ではないことに気づいた。私が意味するのは、対応するエントリのほとんどがMであるか、CのNaNであるということです。これを確認したり、このように関連するエントリの数を計算する方法はありますか? 私はそれらを数値に変換し、相関技術を使ってみましたが、ここ