classification

    0

    1答えて

    私は線形分類コードをテストするためにいくつかのサンプルバイナリデータを検索しています。データが2dで、2つのクラスのいずれかに属しているデータセットが必要です。誰かがそのようなデータや参照を持っている場合は、親切に返信してください。どんな助けもありがとうございます。

    6

    3答えて

    ドメインを、ドメイン名を最大限に活用する異なるカテゴリに分類する必要があります。 ゲームのポータルとして「gamez.com」を分類しています。 Sedoのようなドメイン名の分類を行っているサービスはありますか?

    27

    1答えて

    私はデータマイニング、より正確には意志決定木に関する研究を行っています。このよう パフォーマンス 複雑 などの基準に基づいて 私は決定木構築するための複数のアルゴリズムが存在するかどうかを知りたい(あるいは一つだけが?)、およびその優れています、意思決定の誤り 以上。

    2

    1答えて

    特定のドメイン内のNEを識別する分類子を構築する必要があります。たとえば、自分のドメインがホッケーまたはフットボールの場合、クラシファイアはそのドメインでNEを受け入れますが、Webページに表示されるすべての代名詞ではありません。私の最終的な目標は、NERを通じてテキスト分類を改善することです。 この分野で働いている方には、どのように分類器を作成すればよいですか?感謝! ありがとう!

    2

    1答えて

    PGN(Portable Game Notation)形式の大きなチェスデータベースを持っていますが、一部のゲームではECO(Encyclopaedia of Chessオープン)コード。 これらのタグはすべてのゲームで更新したいので、ゲームの動きに基づいてECOコードを見つけなければなりません。 この機能を提供するPython、Perl、C++、Javaなどのライブラリはありますか?

    0

    2答えて

    各クラスの訓練サンプルサイズが等しい必要があるかどうか教えてください。 このシナリオをとることはできますか? class1 class2 class3 samples 400 500 300 、またはすべてのクラスの標本サイズが同じである必要がありますか?

    46

    3答えて

    訓練されたクラシファイアをどのように保存するか少し混乱します。同様に、使用するたびにクラシファイアを再トレーニングするのは明らかに実際には悪くて遅いですが、必要なときにどのように保存して再度ロードするのですか?コードは以下のとおりです。お手伝いをいただきありがとうございます。私はNLTK Naive Bayes ClassifierでPythonを使用しています。 classifier = nlt

    2

    4答えて

    いいえ。今、この質問はかなり難しいです。私はあなたに例を挙げます。 は今、左の数字は、私のアルゴリズムの分類であり、右の数字は、元のクラスの数であるので、ここであなたが見ることができるように私のアルゴリズムは1に2つの異なるクラスを合併し、それはにクラス86と89を合併し 177 86 177 86 177 86 177 86 177 86 177 86 177 86 177 86

    1

    3答えて

    WekaのNaiveBayes分類を使用して新しく訓練された分類子で分類したいラベルのないデータセットがあります。したがって、実際にwekaのClassifyモードで、Supplied Testオプションを指定すると、ラベルが付けられて評価され、正確さが与えられた場合にのみテストセットが受け入れられます。 しかし、train.csvやtrain.arffファイルを使用してtrain.csファイルを

    10

    2答えて

    私はRuby Classifier library〜classify privacy policiesを使っています。私は、この図書館に組み込まれた簡単な語彙のアプローチが十分ではないという結論に達しました。私の分類精度を上げるために、個々の単語に加えてnグラムで分類子を訓練したいと思っています。 関連するnグラムを取得するためのドキュメントを前処理するためのライブラリがあるかどうか疑問に思ってい