data-science

    2

    1答えて

    私は200個のデータポイントにトレーニングと私のカーネル用に13個の入力機能を使用していGaussianProcessRegressor as part of scikit-learn 0.18.1 を使用しようとしてる - 12個の要素を持つラジアル基底関数を乗じた1つの定数。このモデルは苦情なしで実行されますが、同じスクリプトを何度か実行すると、時々別の解決策が得られることがわかります。最適化

    0

    2答えて

    私は怒鳴る POLYGON((79.87749999947846 6.997500000409782、79.88249999947845 6.997500000409782、79.88249999947845 7.002500000409782、79.87749999947846 7.002500000409782、79.87749999947846 6.997500000409782)) 私はで

    3

    1答えて

    私は多くのユーザー(nUsers)からのデータセットを持っています。各ユーザーは時間的に無作為にサンプリングされます(ユーザーごとに一定でないnSamples)。各サンプルには多数のフィーチャ(nフィーチャ)があります。例えば : nUsers = 3 ---> 3人のユーザ nSamplesの= [32、52、21] --->第一ユーザが第2ユーザがサンプリングした32回サンプリングした52倍等

    1

    2答えて

    私はテキストファイルを持っていますが、その中には多くの行のデータがあります。 :私は、テキストファイルには、次の形式である (すなわち、分析のために別々の、集計.txtに保存)このテキストファイルの各行をチェックする必要がありますし、それに応じてライン内に含まれるデータを処理します(行の残りの部分に含まれている) 番号1または0(データの関連性を示す) ライン毎にIDが(データが何であるかを参照)

    3

    1答えて

    私は、Datacampプラットフォームを使用してTitanicのKaggleチュートリアルを行っています。 私の混乱はDatacampのチュートリアルでは、我々はすべての「男性」を見つけたいということから来ている...列のラベルを使用して行ことで値を選択する - 私はパンダ内の.locの使用を理解します「セックス」列内の入力、と彼らはそれを行うために次のコードを使用し、0の値に置き換えます tit

    -2

    3答えて

    "Hybridization REF"という行があるデータフレームがあります。リストにあるアイテムの1つと同じラベルのアイテムのデータしか取得できないようにフィルタを適用したいと思います。 基本的に、私は次の操作を実行したいと思います: dataframe[dataframe["Hybridization REF'].apply(lambda: x in list)] が、その構文が正しくあり

    0

    3答えて

    私はPythonにはかなり新しく、データを整理する必要があります。私は、ライブラリ、モジュール、実装のためのより良いコード、またはちょうど方向性について、これに関するベストプラクティスに関する助言をしたい。 A:100 B:200 C:300 A:150 B:350 C:370 すなわち: は、だから私は、次の形式で編成されたデータのテキストファイルを持っています各行は関連データ、A/B/

    0

    1答えて

    に要求されたよりも少ない部品を生産、私は次のデータセットに取り組んでいます: http://archive.ics.uci.edu/ml/datasets/Bank+Marketing データはデータフォルダのリンクをクリックすることで見つけることができます。トレーニングセットとテストセットの2つのデータセットが存在します。私が使用しているファイルには、両方のセットの結合データが含まれています。

    -3

    1答えて

    私はこのデータをPythonの下の種類のプロットに視覚化したいと思います。 [('boy', 0.9998371601104736), ('the', 0.9998303651809692), ('s', 0.9998290538787842), ('now', 0.9998087286949158), ('fish', 0.999808669090271), ('up', 0.999808609