2016-10-03 11 views

答えて

1

通常、PCAはではなく、です。

これで、希薄性が失われるためです。パフォーマンス上の理由から、スパースベクトルを使用したいので、PCAは使用しないでください。

+0

これで、1000次元のベクターをどのように使ってみましょうか?例えば、最も近い画像を見つけるために、「最近隣」の問題のために。 BOFベクトルには何千もの次元があると聞きましたが、NNアルゴリズムは(多くても)数百の次元を扱います。 – justHelloWorld

+0

* words *のように扱います。あなたはテキストのどちらかでPCAを実行しません。それはテキスト技術を使用するための "視覚的な言葉"のポイントです。 –

+0

インデックスの各単語がビジュアルワード(ベクトルの特定の次元に対応)である逆索引を使用することをお勧めしますか? – justHelloWorld

関連する問題