data-mining

    0

    1答えて

    与えられたトピックについて、2011年、2010年、2009年などの100のニュース/テキストを取得するPythonスクリプトを作成したいと思います。 私は要件以下の満たされますAPI検索する必要があります。 無料で利用できる、Webサービスとして公開します。 与えられた量のオブジェクトを返します。 日付でフィルタリングしてください。正確には、与えられた年からオブジェクトを得ることができます。 R

    0

    2答えて

    で作成するこれは多少の質問ではありませんが、私はフォーラム を見て、私がしようとしていることを検索する方法を見つけることができませんでした。 私はトレーニングセットを持っており、カテゴリ変数のレベル数を減らす方法を見つけようとしています (下の例ではカテゴリが状態です)。私は州をレベルの平均または率にマップしたいと思っています。 私のトレーニングセットは、データフレームに入力した後、次のようになり

    3

    4答えて

    私たちは、多数の被験者の1分あたりのポストの量を表す数値を持っています。私たちはパターンを見つけることができるようにして、今後投稿の量がどのようになるか予測できるようにしたいと考えています。 パターン検出プロセスを自動的に(人間の介入は必要ありません)、自動化する方法があるかどうか疑問に思っています。私たちは "パターンマイニング"について読んできましたが、作業を開始できるJavaライブラリは見つ

    3

    1答えて

    私はRが新しく、以下のコードで何が間違っているのか、どのように高速化できるか把握できません。 私はデータセットを持っており、2列のデータから計算された平均値を含む列を追加したいと考えています。以下のコードを見てみてください(警告:これは私の質問を読むためにいくつかの時間がかかることがありますが、コードはRで正常に動作):最初の を私はDFは(再び私は長い説明をお詫びデータセットを定義してみましょう

    0

    2答えて

    javaでのKMeansクラスタリング用のコードの生成に問題があります。私はすでにアルゴリズムを知っていますが、Javaコードで記述するのは非常に難しいです。 私の割り当ては、データベースからデータを取り出し、KMeansでクラスタリングを実行することです。この場合、データはまずRecursiveバイナリツリー構造で形成されなければなりません。 シナリオは、I(第一親ノードを作成する親がNULLで

    1

    2答えて

    私は、議会のスピーチで最も頻繁に使用される言葉を特定しようとしており、議員によってそれらを分けなければなりません。私はRとtmパッケージについて学び始めたばかりです。私は最も頻繁な単語を見つけることができるコードを持っていますが、スピーチのスピーカーを自動的に特定して保存するためにどのようなコードを使用できますか? テキストは次のようになります。 OPENING STATEMENT OF SENA

    0

    1答えて

    SQL Server 2005で開発されたレガシーシステムから移行プロジェクトのデータをスクラブしようとしていますが、最初のビジネスは、本当に使用中です。 私のアプローチの背後にある一般的な論理は、大部分が空白のままである(つまり、大部分またはすべての行に、その表のその列に対してNULL値が含まれている)列を識別することです。 TABLE: contacts (10000 records) --

    2

    3答えて

    私は複数のプロジェクトオブジェクトを持つサイトを持っています。各プロジェクトは、(例えば)があります。 複数のタグ 複数のカテゴリ サイズ 複数の種類 など 私はにメソッドを記述したいと思います上記の基準に基づいてすべての「類似の」プロジェクトを取得する。私は簡単に上記のそれぞれの類似のプロジェクト(つまり、同様のサイズのプロジェクトやカテゴリを共有するプロジェクトなど)を簡単に取得できますが、私

    0

    3答えて

    私は映画の評価のこのデータセット使用していたとしますそれは ユーザーIDとしてフォーマットのファイルに評価が含まれていhttp://www.grouplens.org/node/73 を:: MOVIEID ::評価を::この与えられたタイムスタンプ は、私が機能を構築したいです各行はユーザーに対応し、各列はユーザ​​ーがムービーに与えた格付けを示します(存在する場合)。だから、Rプロジェクトでこ

    1

    1答えて

    私は、GoogleのAPIが許すよりも多くの返品結果、すなわち64を使ってPythonで画像検索を行う簡単な方法を見つけようとしています。私はPython Boss Mashup Frameworkを試してみました。私は慎重にインストールの指示に従いましたが、検索を試みると常に認証エラーが返されます。 私は基本的に言葉を検索し、最初に、例えば、100画像のURLを取得したいと思います。特定の検索エ