data-science

    2

    1答えて

    郵便サービスを所有しており、ビジネスプロセスを最適化したいとします。 # date user_id from to weight-in-grams Jan-2014 "Alice" "London" "New York" 50 Jan-2014 "Bob" "Madrid" "Beijing" 100 ... Oct-2017 "Zoya" "Moscow" "St.Pet

    0

    1答えて

    現在、Tensorflowを使用してディープニューラルネットワークを構築しています。 (元の論文を参照してくださいジェフリーヒントンhere)。 Tensorflowは、このの世話をする機能を有している、と私はオーレリアンジェロンの本(途中で、信じられないほどである、)Scikit-学び& Tensorflowとハンズオン機械学習によるチュートリアルを次のようです。その中に、ドロップアウトを実現す

    -2

    2答えて

    Logistic Regressionを使用してモデルを訓練し、名前フィールドと説明フィールドが男性、女性、またはブランドのプロファイルに属するかどうかを予測しました。私の列車精度は約99%であり、試験精度は約83%です。私はCパラメータをチューニングして正規化を実装しようとしましたが、改良はほとんど気づかれませんでした。トレーニングセットには約5,000の例があります。これは、私がSci-Kit

    1

    1答えて

    私はPythonには新しく、最初にRow Totalsで、次にColumn Totalsでユーザームービーレーティングのデータフレームをサブセット化しようとしています。列の合計によるフィルタが完了するまでに数時間かかるので、コードを最適化するためのいくつかのポインタを提供できるかどうかは疑問でした。 data_cols = ['user_id','movie_id','rating']

    1

    1答えて

    私は、次の形式で前処理されたデータを扱う必要があるプロジェクトで作業しています。 データの説明はあまりにも上に与えられてきました。目標は、書かれた数字が前記数字の音声と一致するか否かを予測することである。最初Iのような時間軸上手段にフォーム(N、13)の発話配列を変換: これは話さ内のすべてのアレイのために(1,13)の一貫性のある長さを作成します。これを単純なバニラアルゴリズムでテストするために

    1

    1答えて

    で重複行を削除します。私はdtで重複を削除し、sale_id == 196行を維持する必要があり sale_id dt receipts_qty 31 196.0 2017-02-19 95.0 32 203.0 2017-02-20 101.0 33 196.0 2017-02-21 105.0 34 196.0 2017-02-22 11

    2

    1答えて

    私はジョエル・グラスの「データ・サイエンス」を最初から読んでいました。私の質問は、著者が定理をシミュレートするために二項確率変数を使用していた第6章に関するものです。 結果は、二項検定の確率分布と正規分布を用いた近似プロットのグラフになります。 2つのプロットはお互いに非常に似ているはずです。 Author's Chart 彼は提供コードです: import random from matplo

    0

    1答えて

    誰かが、この作者が正規化で次のコードを使用した理由を教えてもらえますか? 最初の行は、次の式でトレーニングセットを標準化しています。 (X - 平均(X))/ STD(X) 二行目と三行目(検証およびテスト)それらは列車平均(trainme)を使用し、標準偏差を訓練しているが(trainstd)。テスト平均とテスト標準偏差とともに、検証平均(validationme)と検証標準偏差(validat

    1

    1答えて

    私はCSVファイル/ pandas dataframeを扱っています。最初の列には日付が入ります。 ここでは、datetime、フィルタリング、ソート、再索引付けに変換する必要があります。 私が経験することは、操作セットの順序を変更すると、結果が異なります(最初の構成の結果が他の構成の結果よりも大きくなります)。おそらく最初のものは「良い」ものでしょう。 どのサブオペレーションで結果が異なるのか教

    0

    1答えて

    私は過去の注文と販売に関して、新しい注文ごとに推奨モデルを作成するためにそれを行いたいいくつかのアイテム間の相関関係を取得したい選択された製品と他のもの)、私はこの相関関係を得るためのアイディアを持っています。私のデータをピボットするクエリを作成して、アイテムの総量をすべてのオーダーにして、アイテム間の相関を計算します。 Excelシートがすでに添付されています私のケースのサンプルデータがあります