data-mining

    3

    2答えて

    私はNLP(自然言語処理)の新しい参加者です。私は、言い換えプロジェクトを開始するにあたり、2つの類似した文を認識できるシステムを開発しています。レキシカル、シンタックス、セマンティックの3つのレベルで様々な尺度を適用しようとしています。語彙レベルでは、コサイン類似度、マッチング係数、ジャカード係数...などの複数の類似度があります。シェフィールド大学によって開発されたsimMetricsパッケー

    5

    7答えて

    ビジネスインテリジェンスに関する最新の技術、傾向、知識を最新の状態に保つのに役立つコミュニティ、ポータル、およびブロガーを探していますが、予測分析などこのトピックに関する多くのサイトがあるので、私はこの質問をしていますが、そのほとんどはこの種のソリューションを販売するいくつかの企業と提携しているようです。したがって、記事がマーケティング資料であるかどうかを認識することは困難です。

    0

    1答えて

    任意の国の都市リストを作成したいと考えています。 私はGoogleマップのapiを見てきましたが、それは与えられたクエリに対して十分な結果を返せず、 "次の"私が知る限り、クエリの結果。しかし、Googleマップには私が探している情報が含まれていることは明らかですが、問題はそれになっています。 もちろん、ソースはGoogleマップである必要はありません。 Bingマップなども可能性があります。何か

    6

    1答えて

    はDLIBは、C++で自分の機械学習アルゴリズムを開発するための優れたオープンソースのライブラリですか?このようLIBSVM、SHOGUNなどの他のものは約 どのように?マシンは、オープンソース・ソフトウェアの学習については、

    15

    2答えて

    同じ人が書いた2つの英語のテキストがあります。 統計データに基づいて何らかの種類の指紋を作成し、異なるテキストから得られた指紋を比較するマルコフ連鎖アルゴリズムを適用することは可能ですか? たとえば、100文章のライブラリがあります。一部の人はテキスト番号1などを書いていますが、そのうちの1つを書くスタイルを分析して推測する必要があります。 既知のアルゴリズムはありますか?ここにマルコフ連鎖を適用

    0

    1答えて

    Webサイトのソースコードから取得したHTMLがあります。私のページからウェブサイトにポストメソッドを使ってデータを送信し、その応答はソースコードです。私はソースにテキストが必要です。 文書の形式が正しくありません。だから、私はDOMを使用することはできません、私はDOMとタグとデータを分離することはできません。 タグとデータをどのように分けることができますか?どのようにして唯一のデータを得ること

    2

    1答えて

    RandomTree設定でminNumフィールドを観察したとき、私はwekaで遊んでいました。私は "葉の中のインスタンスの最小総重量"という記述を読んだ。 しかし、私はそれが何を意味するのか本当に理解できませんでした。 私はその番号で遊んでいました。私はそれを増やすと、そのようにして生成されたツリーのサイズが小さくなることを認識しました。なぜこのようなことが起こっているのかについては関係がありま

    1

    2答えて

    Hey guys 私は卒業生CS(データマイニングと機械学習)であり、中核となるJAVA(> 3年)によく晒されています。私は デザインパターンに J2EE Webサービス(SOAPとREST) 春の原料の束を読み、 Javaの並行処理を休止している - タスクとエグゼキューなどの高度な機能を。 私は今、これらのことをよりよく理解し、ソフトウェアの終わりを作るために、このようなものを(私の自由時間

    13

    4答えて

    私は卒業生のCS学生(データマイニングと機械学習)で、コアJava(4年超)に暴露されています。私はHadoopとMap/Reduceでたくさんのものを読んでいます。 私は今、より良い理解を得るために、このようなことについてプロジェクトをしたいと思います。 いいプロジェクトのアイデアは本当に感謝しています。私は学ぶためにこれをやりたいので、実際には車輪を再発明する気にはなりません。また、データマイ

    7

    2答えて

    GPSデータセットの解析には2つの質問があります。 1)軌跡の抽出私は、(latitude, longitude, date-time)という形の記録されたGPS座標の巨大なデータベースを持っています。連続したレコードの日時の値によると、私はその人に続くすべての軌跡/パスを抽出しようとしています。例えば;時間Mから、(x,y)のペアは、時刻Nまで連続的に変化しています。 Nの後に、(x,y)のペア