categorization

    0

    1答えて

    古い変数の分類である別の変数(同じデータセットであっても問題ありません)を構築する方法を知りたいと思います。バケツの数を選択します(カットオフとしてパーセンタイルを使用するexemplesの場合:p10, p20, p30など)。 これで変数の百分位数をproc univariateで抽出しました。しかし、これは私にパーセンタイル(私のカットオフ)のみを与えて、その後パーセンタイルを使って新しい変

    1

    1答えて

    グループで分割する必要があるアイテムの「積み重ね」があり、これらのアイテムがどれだけ異なっているかを表すことができれば、数字では、もしあなたが望むなら、私はこの入力をどのように意味のあるグループに分けるのでしょうか? 私はここにしようとし、それをより明確にするためには、私がこれまで試してみました何で、これは抽象的な質問のビットであることを認識: を私はすべての頂点重み付きグラフとして入力を表す試し

    2

    1答えて

    データポイントのコレクションの軸を持つD3で何かを設定しようとしています。しかし、データポイントの外れ値の場合、これらの外れ値を軸上のバケツに入れたいと思います。軸がそれらのデータポイントを配置するためのパーティションとして機能するための「異常値の目盛り」を指定できる方法はありますか? Example: [1,3, 7, 12, 2048] * * * * * --

    0

    1答えて

    が、私はこのようになります患者のデータがあります:最初の列に ID DATE DUR 82 29/08/2014 10.32 82 29/08/2014 0.32 82 12/09/2014 13.35 82 12/09/2014 0.16 82 12/09/2014 0.24 82 12/09/2014 0.31 82 22/12/2014 100.39 82 22/12/

    0

    1答えて

    私には3つの機能があります。 4つの列(MemberID、年、DSFS、DrugCount)でデータフレームを処理し、年ごとに分類された3つのデータフレーム、年を再フォーマットするヘルパー関数、年ごとにデータフレームを分類コード化する3つ目のデータフレームを返します。 第3の関数の入力として、年ごとに分類されたデータフレームはどのように取るのですか? df['DSFS'].unique()を使用し

    2

    2答えて

    私は大きなデータコースプロジェクトに取り組んでいるグループの一員であり、私たちはNLPの問題として認識しています。現在のようなJSONにフォーマットされたデータのグループいます "wine": { "category": "socializing", "category_id": 31, "score": 0.0, "topic_id": 611

    0

    1答えて

    私は94のテキストを分類しようとしています。 trainsetのカテゴリがtestsetのカテゴリに存在しない場合、naiveBayesはうまく動作しないため、私はランダム化して確認しました。 カテゴリに問題はありませんでした。 しかし、クラシファイアはtestsetで動作しませんでした。続き はエラーメッセージです: Df.dtm<-cbind(Df.dtm, category) dim(Df

    1

    3答えて

    私はテキストを分類するためのロジスティック回帰テクニックを練習しようとしています。そして、私はp x n行列、演劇のためのp行とユニークな単語のためのn列の形式でデータセットを構築したいと思います。私はすでに働くテキストを持っていますが、その中の言葉を数えるだけです。 どの演奏にどの言葉が含まれているかを把握することが重要です。演劇のために私はユニークな言葉を引用するPython辞書を作成すること

    5

    2答えて

    文書分類でIDF(逆文書頻度)を計算することに疑問があります。私はトレーニングのために複数のドキュメントを持つ複数のカテゴリを持っています。私は、次の式を使用して文書内の各用語のためのIDFを計算しています: IDF(t,D)=log(Total Number documents/Number of Document matching term); 私の質問は以下のとおりです。 何を意味する「

    6

    3答えて

    ドメインを、ドメイン名を最大限に活用する異なるカテゴリに分類する必要があります。 ゲームのポータルとして「gamez.com」を分類しています。 Sedoのようなドメイン名の分類を行っているサービスはありますか?