text-classification

0熱

1答えて

のための理解のフィルタとストライド形状が、私はデニーブリッツのtutorialTensorFlowでCNNsを使用してテキスト分類上の見直しをしています。フィルター領域とストライド形状は、イメージ領域では完璧な意味を持ちます。しかし、テキストに関して言えば、ストライドとフィルターの形状を正しく定義する方法は混乱しています。 max_sentence_length x embedding_size

-1熱

1答えて

はナイーブベイズテキスト分類は、ベイズ式であることを考えると、実世界のデータ

が必要です。現実の世界では、スパムは約1％です。サンプル入力があると、約1％のスパムが予想されます。クラシファイアをトレーニングしているときに、迷惑メールが1％しかないドキュメントを使用してトレーニングするか、現実の世界で見つかると予想される迷惑メールの割合が非常に高い分類子を練習しても問題ありません。私はスパムの非常に大きな割合を持っている場合は、 P(A) の値が異常に大きいことになる

-2熱

1答えて

フィットネス関連の場合はツイートを分類する

学校プロジェクトについては、ツイートがフィットネス/身体活動に関連しているかどうかを調べる必要があります。データセット全体には、5千万の未ラベルのつぶやきが含まれています。この事業にはどのような分類がありますか？

-1熱

2答えて

実行中のテキスト分類 - GPNのCNN

このgithubのリンクに基づいて、https://github.com/dennybritz/cnn-text-classification-tfに、私のデータセットをGPUのUbuntu-16.04で分類したいと思います。 GPU上で実行されているため、私はこれにtext_cnn.pyにライン23を変更してきた：tf.deviceで（ '/GPU：0'）、tf.name_scope（ "埋め込

0熱

1答えて

テキストドキュメントをテンソルフローのテンソルフローに順次変換するための

テキストコーパスでは、各ドキュメントがおよそ80行である50個のテキストドキュメントがあります。テンソルフローの入力としてコーパスをフィードしたいのですが、システムが各ドキュメントを読み込むときに各ドキュメントをバッチしたいのですか？ TfRecordと同じですが、Tf.Dataを使用してイメージで使用していたものは、私のコーパスの各ドキュメントを順次読み込みます。どうすればこの問題を解決でき

0熱

1答えて

テキスト分類におけるCNNモデルの入力の可変サイズ？

私はこのpaperに基づいてテキスト分類のCNNモデルを実装しました。 CNNは固定サイズの文章しか扱えないので、私はデータセットの文の最大長として入力のサイズを設定し、短い文はゼロを埋めます。しかし、私の理解のために、入力文がどれくらい長くても、最大プール戦略は常に各フィルタマップに対して1つの値しか抽出しません。したがって、入力文のサイズが長くても短くても問題はありません。なぜなら、フィルタが

0熱

1答えて

ケラスで継続目標値を予測できますか？

これは私が持っているデータの例です。 dfの長さは1778360です。検索用語は、検索エンジンで人が入力するクエリです。 CR（コンバージョン率）は連続した数値です。 0から無制限に開始されます。 Search term CR 0 asos french connection lined mac 100 1 hugo boss polo black 50 2 women'