私は英語でクエリを取り、ロシア語で文書を検索するクロス言語情報検索に取り組んでいます。このシステムを評価するには、検索するロシア文書のコレクションを用意するのが良いでしょう。誰もが私が検索することができる文書のコレクションを知っているか、私は簡単に一緒にロシア文書(ウィキペディアを除いて)の束を掻き集めることができますか?彼らは人間の知識のいくつかの特定の領域にあった場合、それはいいだろうけれども検索エンジン用ロシア語文書コーパス
文書は(CS、建築、エンジニアリング、芸術、文学分析、何でも...)何でもすることができ
ウィキペディアで何が問題になっていますか? – Zifre