data-science

    -1

    1答えて

    Pythonやその他の言語で接続してコーディングできる(無料の)Spark開発環境があるかどうかは疑問でした。 おかげ

    1

    1答えて

    私はピソンズライフラインパッケージPackage websiteとGithubを使用しようとしています。読み込みウェブサイトからサンプルを実行しようとした後:次のエラーで Traceback (most recent call last): File "/Kaplan_Meier/Kaplan_Meier.py", line 11, in <module> kmf.plot() File "

    0

    1答えて

    機械学習では、「フィーチャ」と「ラベル」という用語は、私が「独立変数」と「従属変数」(Wikipediaより多くの同義語)として考えるものを参照するのに使用されています。 Wikipedia page describing the term "feature"は、独立変数を記述しているようです。 This discussionも同様の考えを支持しているようです。 これらの用語が同等で、互換性がある

    1

    1答えて

    ユーザー定義関数内でtidyrのgather()の呼び出しを使用したいと思います。コードは次のようになります。 load_and_prepare_data <- function(xls_file, metric_name) { xl <- read_excel(xls_file) xl <- gather(xl, key = "year", value = metric_na

    0

    1答えて

    多くのクラスを含むデータセットに数値以外の変数がありますが、ターゲットクラスの不均衡の場合と同じ問題が発生しますか? たとえば、自分の変数の1つがtitleで、目的が肥満であるかどうかを特定することでした。データの肥満クラスは50:50に分割されていますが、タイトルに「Duke」という行が1つしかなく、この行は肥満クラスにあります。これは、ロジスティック回帰(数値エンコーディング後)のようなアルゴ

    0

    1答えて

    Naive Bayse分類器は線形の分類器ですが、私が決定境界を実装したとき、それは曲線でした(以下に示すように線形ではありません)。またはNBを非線形にする理由がありますか?

    0

    1答えて

    パンダのケーススイッチまたはif-elifチェーンを使用してdatetimeカラムをインクリメントする方法はありますか? def due_date(row): if 5 <= row['num_1'] <= 10: result = pd.to_datetime(row['date']) + pd.to_datetime(df['date']).apply(pd.DateO

    0

    1答えて

    私は、ユーザーが送信したメッセージに関する情報を含むpandasデータフレームを持っています。 私のモデルでは、メッセージの受信者の欠落を予測することに興味があります。受信者A、B、Cがメッセージを受け取った場合、他の誰が受信者の一部であったかを予測したいと考えています。 私はOneVsRestClassifierとLinearSVCを使用して複数ラベルの分類を行っています。 機能については、メッ

    1

    1答えて

    私はこのような構造を持つパンダのデータフレームを持っている:与え df = pd.DataFrame({'entry': [['A','B','C'],['A','B','E','D'],['C'],['D','A', 'B'],['D','C','E'],['E','A']]}) : entry 0 [A, B, C] 1 [A, B, E, D] 2 [C] 3 [D, A, B]

    0

    2答えて

    条件のセットを考慮して、列の観測値を置き換えようとしています。与えられたデータは、次のとおりです。 Sex Age male 34.5 female NA male 62 male NA 私はセックスが女性で、年齢値が値によってNAでデータを交換したいと思います。 私は現在のようにforループを使用しています: for(i in 1:length(data$Sex){ if