data-mining

    5

    1答えて

    多量のテキストがあり、最も頻繁に発生するテンプレートを発見しようとしている場合、N-Gramアプローチを使用して解決することを考えていましたが、実際にはthisの解決策として提案されましたが、わずかに異なる。私はラインの万人に拡大することができますアプローチを探しています I wake up every day morning and ... and then go to work I am n

    1

    1答えて

    KDDデータセットの1つで使用される侵入検知システム(IDS)を開発したいと考えています。このケースでは、私のデータセットは42の属性と4,000,000を超えるデータ行を持っています。 ファジー関連ルールを使用してIDSを構築しようとしています。そのため、実際には、このコンテキストではファジーロジックにとって最適なツールとは何でしょうか?

    1

    1答えて

    Twitterのようなサイトの履歴メッセージのストリームを抽出しようとしています。基本的に私たちは皆、Twitterの「MORE」ボタンを知っています。このサイトは、JSONオブジェクトを取得して解析するようなものがあります。 JSONオブジェクトが配置されている場所、私が把握することができますどのように私は より多くのJavaScriptコードはここに示されている...データをマイニングするCU

    17

    2答えて

    私は過去2時間の間、SOのnlpタグを見てきました。何も見逃していないと確信していますが、もし私がしたら、私に質問してください。 しかし、私は何をしようとしているのかを説明します。私が多くの記事で見た共通の概念は、意味の類似性が難しいということです。例えば、thisポストから、受け入れられた解決策は、次のことを示唆している: First of all, neither from the persp

    -2

    1答えて

    私の仕事は、特定の名前のウェブサイトをデータマイニングすることです。私のPythonの経験はあまり高くありません。 [u'Bobジョー '] [u'Timトム'] [u'Anneフランク '] [u'superman':私はすべての名前をこすり落としたとき、彼らはこの形式で出てきます] これらの値をクリーンアップするにはどうすればよいですか? 「u」は何を意味していますか?私のxpathは間違って

    0

    1答えて

    これはそれについて質問するのに適した場所ではありませんが、Greenplumについて知っている人は誰ですか? 私は、私の場合には、WWW、 のミラーを大規模なデータを処理し、データ上で検索を行うことが可能であるためにDBMSについて研究してきた、私は今のNoSQLと 誰かにPostGreへのMySQLから移動しましたこの1つを指摘したが、誰かがそれに関する経験を持っているかどうかを知りたかっただけ

    0

    1答えて

    私はジョブの大きなデータベースを持っており、各ジョブは(位置、フィールド、給与、必要な経験...)のような数値と非数値属性を持っています と(年齢、期待される給料...) 私は、ジョブと適切な候補者の間の自動マッチングを行うアプリケーションを作成したいと考えています。このアプリケーションを実装するための最良のアルゴリズム(データマイニングまたは人工知能)は何ですか? * THXご返信用

    2

    3答えて

    perl APIを使用してウェブサイトからデータを抽出しようとしています。このプロセスでは、urisのリストを入力として使用します。次に、ウェブサイトから各URIの関連情報を抽出します。 1つのURIの情報が存在しない場合、それは死ぬ。以下のコードのようなもの my @tags = $c->posts_for(uri =>"$currentURI"); die "No candidate rel

    2

    1答えて

    複数の属性を持つオブジェクトの集合をクラスタ化し、ある属性は他の属性よりも重要です これらの特定の属性に重大な重みを与えることで、他の人は?

    0

    1答えて

    私はデータをマイニングするためにHTMLCleanerを使用....ここ は、それが働くん方法です: HtmlCleaner cleaner = new HtmlCleaner(); final String siteUrl = "http://www.apple.com/"; TagNode node = cleaner.clean(new URL(siteUrl));