word2vecと組み合わせて使用される用語「ネガティブサンプリング」と「サブサンプリング」について聞いています。マイナスサンプリングとサブサンプリング
word2vecを使いこなそうとする前に、単語の埋め込みを参照して最初からやり直すようにしています。 (あなたがリンクを信用していない場合は、 "ベクトル空間でWord表現の効率的な推定"、をGoogleに。)
を
https://gul.gu.se/public/pp/public_courses/course77642/published/1497871737091/resourceId/37659332/content/UploadedResources/lecture10-slides-word2vec_sungmin_VT17.pdfをし、状態::ペーパー・トレイルは、私をここに上陸した
を(私はすべての箇条書きで最初のマイナス点を熟知しています)
マイナスサンプリングとサブサンプリングで見つかった唯一のものは、word2vecに関する記事に含まれています。私は避けようとしていることです。
誰でもこれらの用語を説明したり、正しい方向に向けることができれば、非常に感謝します:)。
編集:
「サブサンプリングは、全ての観測よりも少ないがで使用された元のサンプルサイズ対(交換で描画されているブートストラップに似リサンプリング手順は次のとおりです。それは自己だサブサンプリングタグは、この定義につながります教科書のブートストラップ方法)既存のデータからサンプルを作成するには、代わりに「サンプリングする」タグを検討してください。 ---これの具体例が素晴らしいでしょう。