unsupervised-learning

-2熱

1答えて

私はMxNのオーダのデータセットを持っています。私はニューラルネットワークを使用してこのデータセットでバイナリ分類を実行したいと思います。私はリカレントニューラルネットワークを検討していました。 LSTMはオートエンコーダに使用できますが、分類に使用できるかどうかはわかりません（私はバイナリ分類をしようとしています）。私はニューラルネットワークと深い学習モデルには非常に新しく、ニューラルネットワー

1熱

2答えて

教師付きまたは非教師あり

ニューラルネットワークの分類問題を解決しようとしているときに、データセット内のクラスがk-meansで計算されます。それは監督されているか監督されていない学習ですか？

0熱

1答えて

直接/間接および監視/非監督/強化学習

直接/間接と監督/非監督/強化学習の間にマッピングがありますか？私には、直接学習授業と間接学習援助学習のように見えますが、これについての良い参考文献は見つかりませんでした。

3熱

1答えて

アフィニティ伝播の優先パラメータ

scikit-learnの親和性伝播の実装を使用して、類似性メトリックとして修正されたJaro-Winklerの距離を使用して、エンティティ名のセットをクラスタリングすることを推奨しましたが、多くの偽陽性）私は、以下の説明で、クラスタの数に影響を及ぼしの好み 'パラメータが存在するとscikit-学ぶドキュメントで参照：。好み：配列のような、シェイプ（n_samples、）または浮動小数点（任

0熱

1答えて

LDA - トピックへのキーワードの割り当て

私は約150,000のドキュメントの構造化されていないデータを持っています。私は教師なし学習アルゴリズムを使用してこれらのドキュメントをグループ化しようとしています。現在、gensim PythonでLDA（Latent Dirichlet allocation）を使用しています。 LDAModelについては、num_topics = 20を渡しました。したがって、私の全150kデータは20のトピ

0熱

1答えて

入力層にドロップアウトを使用したpythonテンソルフロー

私はtfでpythonを使用しており、mnistデータ用の自動ノイズ除去エンコーダのトレーニング中に入力の一部をマスクする適切な方法を探しています。私は入力層にドロップアウトを使用しましたが、隠れた層に使用しているのと同じ方法で、結果はあまり良くありません。なぜなら、自動エンコーダの問題は何かを知るのは難しいです。すべての深い学習アーキテクチャ私は入力層を含め、ドロップアウトのために使用される

0熱

1答えて

リポジトリから類似ファイルを探す

私はファイルのリポジトリを持っています。これらのファイルは、人間によって作成された平易な英語のテキストです。各ファイルには、いくつかの事件を記述する段落はほとんどありません。ここでは、それぞれの人が異なるため、異なる文法で2つ以上のインシデントを記述することができます。同じ人でも、異なる文法で異なる言葉で事件を書く傾向があります。どのようにして類似のファイルを検索してクラスタリングできますか？

3熱

1答えて

h2o word2vecで使用するための事前ベクタを提供していますか？

H2Oは最近、そのAPIにword2vecを追加しました。自分で提供するコーパスに自分の単語ベクトルを簡単に訓練できることは素晴らしいことです。しかし、GoogleやH2O.aiなどのソフトウェアベンダーがH2Oのエンドユーザーではなく、ネットワークの帯域幅のためにアクセスできるタイプの大きなデータと大きなコンピュータを使用することにより、さらに大きな可能性が存在します。電力制限を計算する。ワ

1熱

1答えて

R内のapcluster：メモリ制限

Rでクラスタリングを実行しようとしています。使用したアルゴリズムはapcluster()です。私が使用したスクリプトは： s1 <- negDistMat(df, r=2, method="euclidean") apcluster <- apcluster(s1) 私のデータセットは約0.1百万行あります。私は、スクリプトを実行したときに、私は次のエラーを得た：私はオンラインで検索すると

0熱

1答えて

テキストファイルを2つのグループに分ける - 教師なし学習

あなたは図書館員であり、時間がたっている間には多くの種類のテキストファイルを分類しています（約100）一般的なあいまいなキーワードです。すべてのテキストファイルには、実際にkeyword_meaning1 またはkeyword_meaning2の話題のトピックです。どの教師なし学習アプローチあなたは二つのグループにテキストファイルを分割する、使うのでしょうか？正しい分類の（パーセンテ