data-mining

3熱

1答えて

現在メールアドレスがメーリングリストアドレスかグループメールアドレスか個人用メールアドレスかを判断する機能を構築しています。私の現在の戦略は人間によるマニュアル注釈を使用しており、これらのデータは受信メールアドレスを決定するために使用されます。例[email protected]は郵送先住所なので、このメールアドレスの名前はrecruitmentで、グループとしてマークするので、今後は名前がrec

-1熱

2答えて

要素からhtmlの要素のタイトルと段落を抽出するスタイル

要素スタイル（fontSize、fontWeight、...）に基づいたhtmlファイルからタイトルとパラグラフを抽出するには、最適なデータ解析方法は何ですか？私はすでにテキストとfontSize属性を抽出し、それらをcsvファイルに入れました。このデータを分類（またはクラスタ化）する方法を知る必要があります。たとえば、fontSizeが20pxのすべての要素を私に与えることができます。 + 5p

-1熱

1答えて

混乱行列のFscore値に関するクエリ

多クラス分類のための混同行列で作業しています。そのためにFスコアを計算していますが、私は1.4をvalue.Howとして取得しています。最適な結果か何ですか？私を助けてください！ありがとうございます。

0熱

1答えて

異常検出のパターンを定式化するために、Pythonのクラスタ機能をどのように分析しますか？

私はISCX Dataset 2012で異常検出を研究しています。私はWeka Libraries for Pythonを使ってK-meansクラスタリングを適用しました。それはクラスタ情報を印刷しますが、それは、私はいくつかの変数にクラスタ機能（各機能の平均）を保存することができもそれは私にどのタプルについての情報を与えないしません。どのクラスターに入るか。他のライブラリを検索してクラス

0熱

1答えて

sklearn.model_selection.cross_val_scoreのスコア関数式は何ですか？

私は、sklearn.model_selection.cross_val_score関数がmake_scorer()関数を使用することを知っています。この関数は、エスティメータの出力を評価する呼び出し可能関数を返します。 cross_val_score()で使用されているスコアリング関数は何ですか？私はそれが以下の選択肢の一つだと思う： accuracy_score mean_squared_e

0熱

1答えて

複数の商品データの予測

次の5件の注文と、3件の商品の数量を各注文で予測したいと考えています。私はrとtimeseriesを使用して初心者と私はarimaを用いた例を見たが、彼らは私の例のように一つだけを測定していない複数の製品を適用しています。 arimaを使用しますか？どうすればいいですか？私の悪い英語を申し訳ありません。前もって感謝します。 dateordrer,product1,product2,produ

-1熱

1答えて

Wekaで実行時間をミリ秒フォーマットで取得する方法

私はWEKA jvmを使用しており、データに対して一般化されたシーケンシャルパターンアルゴリズムを実行しようとしています。私はミリ秒で実行時間を取得したい。どうしたらいいですか？

-1熱

1答えて

トレーニングデータ

地震など自然災害については約800万本のつぶやきがあります。そして、私は、テキストの内容に従って、つぶやきをヘルプの提供、傷害の報告、寄付、または同情のような異なるカテゴリに分類するモデルを構築しようとしています。クラシファイアのトレーニングに使用できるトレーニングデータセットを教えてください。は、私が危機についてラベルされたツイートが含まれてこれらのデータセットhttp://crisisl

-2熱

4答えて

文字に基づいて類似の単語を見つけるアルゴリズム

私は、共有文字に基づいて単語（テキスト文字列）の類似性を検出する方法を探しています。私はハッシュ関数、特にRabin-Karpアルゴリズムを探して、大きな文字列の中で似たような単語を探しました。しかし、私がしたい場合にdoesntの仕事：単語の三つの例は、私はドイツの銀行に基づいて私の場合は「類似」を検討：は「ドイツ銀行」があり、「ポストバンク」、および「ランデス」。 3人はすべて自分の名

0熱

1答えて

反モンタニティと単調性の制約は何を意味しますか？

私はこの答えをウェブで見てきました。私が得たものは、両方の場合に似た定義です。これは私が見つけたものです：モノトーンの制約は次の性質を持っています。項目セットSが単調制約Cに違反すると、そのサブセットのいずれかもCに違反する。同様に、単調制約Cを満たすアイテムセットのすべてのスーパーセットもCを満たす（すなわち、Cは上向きに閉じられる）。 Monotone アンチモノトーン制約には、次のnice