data-science

    0

    1答えて

    時系列予測モデルを構築する必要があり、私が持っているのは、ユーザーがサイトにログインするときのタイムスタンプのシーケンスです。どのようにモデリングしますか。 ここにデータの最初の数行があります。私はこれをパンダシリーズとして持っています。今 0 2012-03-01 00:05:55 1 2012-03-01 00:06:23 2 2012-03-01 00:06:52 3 2012-03-

    0

    1答えて

    これは非常に新しいので、あらゆる種類の情報が役立つでしょう。私が非常に些細な質問をした場合、謝罪します。 私は多くのゼロを持つ中規模のデータセットを作成しています。私たちは多くのモデルを適用し、k = 10のcv-skfスコアは0.85を超えましたが、roc_aucスコアは0.5付近に固定されています。私はsklearnを使用しています。以下はコードスニペットです。 train_dataset =

    0

    1答えて

    私は現在グラフから冗長なデータポイントを削除するはずのスクリプトを書いています。私のデータには隣接するデータセットからの重複が含まれています。 (xオフセットがわずかに重なる2つのガウス分布を想像してみてください)重複領域の高い方の値だけに興味があり、単一のスペクトルを作るためにデータを結合すると最終的なグラフがすべてノイズにならない。ここでは) 私の問題です: 1)xの値は、2つのデータセット間

    1

    1答えて

    私はちょうどビーカーノートブックを発見しました。私はこのコンセプトが大好きで、それを仕事に使うことが切望されています。そのためには、自分のコードを他の形式でも共有できることを確認する必要があります。 質問 は、私はビーカーノートでピュアPythonを書く言う:私はiPythonノートブック/ Jupyterでできるよう は私がの.pyファイルとして保存することができますか? 純粋なビーカーノートブ

    2

    1答えて

    私はdatabricksがノートブックを"production-grade" rest APIに変換する可能性を提供していることを知っています。 Zeppelin、Scala-Notebook、Jupiter Notebook、hue-notebookなどのオープンソースノートブックにも同様の機能がありますか?ソリューションがsparkRをサポートするのであれば素晴らしいことでしょう。 https

    0

    1答えて

    以下のワークフローを使用して、本番用のランダムフォレスト分類子を訓練しています。私は、RandomizedSearchCVを使用して、結果を出力し、RandomizedSearchCVの結果を使用して新しいパイプラインを作成することによって、分類器のパラメータを調整しています。私は、RandomizedSearchCVの最良の結果をクラシファイアに単に指し示す方法が必要であると想定しているので、私

    0

    1答えて

    私は初心者のためのパスを構築しています(私のような)Rのデータ分析の学習を通してそれらを導く(Rでお願いします)。 新しいセクションや新しく追加する必要のあるコースを教えてください。助けのためのhttp://studiy.co/path/data-analysis/ 感謝を: 相続人は私が今まで追加されているかどうかです!

    0

    3答えて

    BLOCKQUOTE 私は機械学習の学生や初心者です。私は機能をしたい 列の選択。私のデータセットは50000 X 370であり、それはバイナリの 分類問題です。 最初にstd.deviation = 0の列を削除した後、重複する列を削除した後、ROC曲線の面積が最も大きい20の機能をチェックアウトしました。 PCAを行う次のステップは何でしょうか?誰でも機能の選択に従う一連のステップを与えること

    0

    1答えて

    spark.ml.classification.LogisticRegressionのスカラコードをいくつか変更したいと思いますが、スパーク全体を再構築する必要はありません。 spark-submitまたはpySparkのいずれかの実行にjarファイルを追加できるためです。 LogisticRegression.javaの変更されたコピーをコンパイルし、Sparkのデフォルトのメソッドをオーバーラ

    0

    1答えて

    を使用してRでのJDBCドライバの作成: 私はすでに私は次の取得の.jarフォルダが drv <- JDBC("com.mysql.jdbc.Driver", "mysql-connector-java-3.1.14-bin-g.jar", identifier.quote="`") に位置している場所にディレクトリを設定していますエラー: Error in .jf