text-classification

    0

    1答えて

    のための理解のフィルタとストライド形状が、私はデニーブリッツのtutorialTensorFlowでCNNsを使用してテキスト分類上の見直しをしています。フィルター領域とストライド形状は、イメージ領域では完璧な意味を持ちます。しかし、テキストに関して言えば、ストライドとフィルターの形状を正しく定義する方法は混乱しています。 max_sentence_length x embedding_size

    -1

    1答えて

    が必要です。現実の世界では、スパムは約1%です。サンプル入力があると、約1%のスパムが予想されます。 クラシファイアをトレーニングしているときに、迷惑メールが1%しかないドキュメントを使用してトレーニングするか、現実の世界で見つかると予想される迷惑メールの割合が非常に高い分類子を練習しても問題ありません。 私はスパムの非常に大きな割合を持っている場合は、 P(A) の値が異常に大きいことになる

    -2

    1答えて

    学校プロジェクトについては、ツイートがフィットネス/身体活動に関連しているかどうかを調べる必要があります。データセット全体には、5千万の未ラベルのつぶやきが含まれています。 この事業にはどのような分類がありますか?

    -1

    2答えて

    このgithubのリンクに基づいて、https://github.com/dennybritz/cnn-text-classification-tfに、私のデータセットをGPUのUbuntu-16.04で分類したいと思います。 GPU上で実行されているため、私はこれにtext_cnn.pyにライン23を変更してきた:tf.deviceで( '/GPU:0')、tf.name_scope( "埋め込

    0

    1答えて

    テキストコーパスでは、各ドキュメントがおよそ80行である50個のテキストドキュメントがあります。 テンソルフローの入力としてコーパスをフィードしたいのですが、システムが各ドキュメントを読み込むときに各ドキュメントをバッチしたいのですか? TfRecordと同じですが、Tf.Dataを使用してイメージで使用していたものは、私のコーパスの各ドキュメントを順次読み込みます。 どうすればこの問題を解決でき

    0

    1答えて

    私はこのpaperに基づいてテキスト分類のCNNモデルを実装しました。 CNNは固定サイズの文章しか扱えないので、私はデータセットの文の最大長として入力のサイズを設定し、短い文はゼロを埋めます。しかし、私の理解のために、入力文がどれくらい長くても、最大プール戦略は常に各フィルタマップに対して1つの値しか抽出しません。したがって、入力文のサイズが長くても短くても問題はありません。なぜなら、フィルタが

    0

    1答えて

    これは私が持っているデータの例です。 dfの長さは1778360です。 検索用語は、検索エンジンで人が入力するクエリです。 CR(コンバージョン率)は連続した数値です。 0から無制限に開始されます。 Search term CR 0 asos french connection lined mac 100 1 hugo boss polo black 50 2 women'