feature-extraction

    1

    1答えて

    ソーシャルネットワーク(FB、twitter)からのコメント、一般および地域のニュースや雑誌などからのコメントを含む約6000件のコーパスがあります。私はこれらのテキストの最初の300件を読んで、これらの300個のテキストのそれぞれを顧客の苦情または非苦情としてタグ付けしています。 私は、素朴な言葉の袋の代わりに、これらの苦情や非苦情のテキストをどのように正確に抽出することができますか?私の目標は

    0

    1答えて

    イメージからある特定のポイントの抽出を特徴づけようとしています。初めて私はHogFeatureextractionを使用しています。フィーチャーと有効なポイントをプロットすると、特定のポイントではなく結果が得られます。私は後でこれらの機能をトレーニングに使用します。たとえば、私は直線上に点を持っています。私の特徴は、私の特定の点がどこにあるのかではありません。私はそれのコンセプトについてちょっと混

    3

    1答えて

    私は3つの異なるHoGコードをダウンロードしました。 MATLAB関数を使用して)64x128 1の画像を使用して:extractHOGFeatures、 [hog, vis] = extractHOGFeatures(img,'CellSize',[8 8]); をhogのサイズは3780. どのように計算することである: HOG特徴長、Nは、画像サイズおよび関数パラメータ値に基づく。 N

    2

    1答えて

    私は今Python 3.6を切り替えましたが、有益な機能を実行すると、私の機能抽出プログラムでロシア語を印刷しようとしているときにうんざりしてしまいます。私はтирがうまく印刷するために得ることができ、特徴抽出自体 def POS_features(word): return{'three_last_letters':word[-3:]} print(POS_features(u'Бо

    2

    1答えて

    私はイメージの縫い合わせのためにシフトフィーチャ抽出を使用しています。 matlabでvl_siftを使用しています。 しかし、抽出された特徴は画像に均等に分布していない。ある時点で私はそれらのいくつかを持っていますが、他の点は私にはありません。 どうすればこの問題を回避できますか?

    0

    2答えて

    イベントの説明テキストがいくつかあります。 イベントの入場料を引き出したいと思います。 入場料が条件付きであることがあります。 私が達成したいのは、入場料とその条件(利用可能な場合)を抽出することです。入場料+その条件を示すフレーズや文章全体を検索するのは大丈夫です。 注I:テキストはドイツ語で書かれています。注意:ほとんどの場合、文章は主にイベントチラシまたは広告であるため、完全ではありません。

    0

    1答えて

    Spark MLlibで意思決定ツリーを使用するときに、数値の欠落した機能を処理するにはどうすればよいですか? 欠落しているフィーチャを他の値の平均値に置き換えることを検討していますが、モデルの品質にどのような影響があるかわかりません。 Spark MLlibはこの共通の問題をサポートしていますか?

    0

    1答えて

    私は草の雑草の検出に取り組んでいます。私はHoG記述子から特徴を抽出し始めました。 HoG文献から研究されているように、HoGは回転不変ではない。私は草の雑草の各クラスの合計18の画像を持っており、2つのクラスがあります。私のトレーニングとテストのデータベースでは、各イメージ[5 10 15 20 ... 355]度を回転させました。 トレーニングとテストはLibSVMパッケージを使用して行われま

    -1

    1答えて

    画像内の影、他の遠い車、さまざまなタイプを考慮して、正面、側面または背面の画像を含む画像から車全体を抽出する方法自動車(ハッチバック、セダンなど)の? イメージの車はフロント、リア、またはどちらかのサイドになります。それは修正されています。 さまざまな色と背景で車種が異なる場合があります。 私は に研究してきた - エッジ検出アルゴリズム(Sobel、Canny)を、 特徴抽出のためのScale-

    1

    1答えて

    私は、指向性勾配(HoG)と畳み込みニューラルネットワーク(CNN)のヒストグラムを雑草検出の比較に取り組んでいます。私は2つの異なる雑草の2つのデータセットを持っています。 CNNアーキテクチャは3層ネットワークです。 1)第1のデータセットは2つのクラスを含み、18の画像を有する。 データセットは、私は77%の検査精度を取得し、SVM 78%を有するブタのための午前CNNを用い (ノイズ、照明