text-classification

    0

    1答えて

    あなたは図書館員であり、時間がたっている間に は多くの種類のテキストファイルを分類しています(約100) 一般的なあいまいなキーワードです。 すべてのテキストファイルには、実際にkeyword_meaning1 またはkeyword_meaning2の話題のトピックです。 どの教師なし学習アプローチあなたは二つのグループにテキストファイルを分割する 、使うのでしょうか? 正しい分類 の(パーセンテ

    -2

    1答えて

    私は、店舗で生成された請求書/請求書をスキャンし、店舗名、住所、購入した商品、請求額などのキー機能を抽出できるモバイルアプリを作成する予定です。 OCRは法案(スキャンされた請求書または法案の写真)からテキストを抽出しますが、どのようにこれらの詳細をすべて抽出するのですか?どのようなアプローチを使用する?まあ

    2

    1答えて

    教師付き分類のためのpaper on fasttextでは、著者はいくつかのパラメータを変更することでさまざまな隠れ単位を指定しました(hは3,4ページのものです - 表1では " 10個の隠れたユニットがあり、それをバイグラムの有無にかかわらず評価する」)。しかし、the documentationを読んだ後は、変更する「隠れユニット」パラメータがないように見える。隠れユニットの数を指定する方法

    4

    1答えて

    私は、Pythonでのテキスト分類のために、多項式Naive Bayes Classifierをゼロから実装しています。 フィーチャの各クラスと確率分布のフィーチャ数を計算します。 は私の実装によると、私は次のような結果が得られます。両方のクラスの事前確率は0.5 になります。このコーパスのためにナイーブベイズによると corpus = [ {'text': 'what is cha

    1

    1答えて

    の結果に分類を行うために、私はコアNLPについての質問のカップルを持っていると分類を行って、 を言う必要があります。 link1 link2 link3 link4 及びこれに関連するいくつかの他、 が、私の混乱: 私はこれらのリンクに直面したとき、私はそれから得る、私は私がそれらを分類するようになったcorenlpの結果に何かを行うことができますことを幸せでした精度、 corenlpの他の結果の

    0

    1答えて

    私はWekaのJAVA APIを使用して、さまざまなテキスト機能に従って文書を分類しています。 TextDirectoryLoaderクラスを使用する場合、テキストを含むtxtファイルを含むディレクトリをロードすることができます。テキストを数値フィーチャに変換し、後でそのインスタンスを分類します。問題は、このテキストがデータセット内の単一の文字列フィーチャによって表されることです。例えば :Sys

    0

    1答えて

    私はあるコメント集を持っており、それぞれのコメントがトピックについて議論しています。私はこれらのコメントで議論されたトップのトピックを把握したい。また、私はこれらのコメントをオンラインで受け取っています(つまり、私は一言で全体のコメントを取得するのではなく、これらのコメントを1つずつ処理する必要があります)。私はWord2Vecを使って特徴抽出を行い、k-means(クラスタはトピックに対応する)

    -1

    1答えて

    私のトレーニングデータセットと確率計算に基づいて、ある値を予測しています。それらを合計すると、常に1または100%を与えます。 これは私のトレーニングデータです Address Location_ID Arham Brindavan,plot no.9,3rd road Near ls Stn,cannop 4485 Revanta,Behind nirmal p

    0

    1答えて

    シンプルなNaive Bayesを使ってScikitを学習しています。 本質的に、それぞれCat AとCat Bという名前の2つのフォルダがあり、それぞれが1,500個のテキストファイルで構成されています。 私はそうのような分類器を訓練するためにこれらのファイルをロードしています: # Declare the categories categories = ['CatA', 'CatB']

    0

    1答えて

    sklearnでテキスト分類器を作成し、coremltoolsパッケージを使用してiOS11マシン学習ファイルに変換したいと考えています。 Logistic Regression、Random Forest、Linear SVCという3つの異なる分類子を構築しましたが、それらはすべてPythonでうまく動作します。 問題はcoremltoolsパッケージとsklearnモデルをiOSファイルに変換