data-science

0熱

1答えて

時系列予測モデルを構築する必要があり、私が持っているのは、ユーザーがサイトにログインするときのタイムスタンプのシーケンスです。どのようにモデリングしますか。ここにデータの最初の数行があります。私はこれをパンダシリーズとして持っています。今 0 2012-03-01 00:05:55 1 2012-03-01 00:06:23 2 2012-03-01 00:06:52 3 2012-03-

0熱

1答えて

良いクロスバリデーションスコアを取得するが、非常に悪いRoc_aucスコアを取得する

これは非常に新しいので、あらゆる種類の情報が役立つでしょう。私が非常に些細な質問をした場合、謝罪します。私は多くのゼロを持つ中規模のデータセットを作成しています。私たちは多くのモデルを適用し、k = 10のcv-skfスコアは0.85を超えましたが、roc_aucスコアは0.5付近に固定されています。私はsklearnを使用しています。以下はコードスニペットです。 train_dataset =

0熱

1答えて

2セットのノイズの多いデータの交差を見つけるにはどうすればよいですか？

私は現在グラフから冗長なデータポイントを削除するはずのスクリプトを書いています。私のデータには隣接するデータセットからの重複が含まれています。（xオフセットがわずかに重なる2つのガウス分布を想像してみてください）重複領域の高い方の値だけに興味があり、単一のスペクトルを作るためにデータを結合すると最終的なグラフがすべてノイズにならない。ここでは）私の問題です： 1）xの値は、2つのデータセット間

1熱

1答えて

ビーカーノートブックをまっすぐなpython/r/...として保存するにはどうすればいいですか？

私はちょうどビーカーノートブックを発見しました。私はこのコンセプトが大好きで、それを仕事に使うことが切望されています。そのためには、自分のコードを他の形式でも共有できることを確認する必要があります。質問は、私はビーカーノートでピュアPythonを書く言う：私はiPythonノートブック/ Jupyterでできるようは私がの.pyファイルとして保存することができますか？純粋なビーカーノートブ

2熱

1答えて

ノートブックを生産残りのAPI

私はdatabricksがノートブックを"production-grade" rest APIに変換する可能性を提供していることを知っています。 Zeppelin、Scala-Notebook、Jupiter Notebook、hue-notebookなどのオープンソースノートブックにも同様の機能がありますか？ソリューションがsparkRをサポートするのであれば素晴らしいことでしょう。 https

0熱

1答えて

分類器へのRandomizedSearchCVのポインティング

以下のワークフローを使用して、本番用のランダムフォレスト分類子を訓練しています。私は、RandomizedSearchCVを使用して、結果を出力し、RandomizedSearchCVの結果を使用して新しいパイプラインを作成することによって、分類器のパラメータを調整しています。私は、RandomizedSearchCVの最良の結果をクラシファイアに単に指し示す方法が必要であると想定しているので、私

0熱

1答えて

パス：Rのデータ分析R

私は初心者のためのパスを構築しています（私のような）Rのデータ分析の学習を通してそれらを導く（Rでお願いします）。新しいセクションや新しく追加する必要のあるコースを教えてください。助けのためのhttp://studiy.co/path/data-analysis/ 感謝を：相続人は私が今まで追加されているかどうかです！

0熱

3答えて

機能選択のテクニックに関する提案？

BLOCKQUOTE 私は機械学習の学生や初心者です。私は機能をしたい列の選択。私のデータセットは50000 X 370であり、それはバイナリの分類問題です。最初にstd.deviation = 0の列を削除した後、重複する列を削除した後、ROC曲線の面積が最も大きい20の機能をチェックアウトしました。 PCAを行う次のステップは何でしょうか？誰でも機能の選択に従う一連のステップを与えること

0熱

1答えて

スパーク：オーバーライドライブラリメソッド

spark.ml.classification.LogisticRegressionのスカラコードをいくつか変更したいと思いますが、スパーク全体を再構築する必要はありません。 spark-submitまたはpySparkのいずれかの実行にjarファイルを追加できるためです。 LogisticRegression.javaの変更されたコピーをコンパイルし、Sparkのデフォルトのメソッドをオーバーラ

0熱

1答えて

は、私は次のコードを使用してRにJDBCドライバを作成しようとしていますRJDBC

を使用してRでのJDBCドライバの作成：私はすでに私は次の取得の.jarフォルダが drv <- JDBC("com.mysql.jdbc.Driver", "mysql-connector-java-3.1.14-bin-g.jar", identifier.quote="`") に位置している場所にディレクトリを設定していますエラー： Error in .jf