2012-02-06 10 views
0

ファイルタイプ別にフィルタを設定しようとしています。Google検索アプライアンス - ファイルタイプをフィルタリングする最適な方法

特別なクエリ用語File Type FilteringまたはFile Extension Filterを使用すると、クエリ用語の最後にテキストが追加されます。これは "abc etx:pdf"の検索結果を表示し、それを理想的ではない提案にも追加します。

ファイルタイプごとに別々のフロントエンドを設定するか、as_filetypeを使用すると、同様の問題が発生します。

私は実際には70個以上のコレクション(私はクロールしている10のサイトがあります)で終わるので、それぞれ別々のコレクションを設定する必要はありません。

クエリ用語に追加されていないMIMEまたは拡張による結果をフィルタリングする他の方法がありますか? MIMEや拡張機能でフィルタリングする最良の方法は何ですか?

+2

のように見えるのでしょうか?私も同じを探しています – GoodSp33d

+1

ナア、検索の時間の後、私は数十のコレクションを作成することが最良の解決であるという結論に終わった。クエリを妨げず、パフォーマンスも向上します。 –

答えて

0

ファイルの拡張子がURLに含まれている場合は、エンティティ認識を使用して、ファイル拡張子を値として持つ特別なメタデータエントリを追加できます。または、Webサーバーからファイル用の特別なHTTP応答ヘッダーを返すこともできます。このヘッダーはファイルの追加メタデータとしてGSAで構成できます。

ファイルの特定のメタデータフィールドを取得したら、requiredfieldsパラメータを使用して、検索語句を汚染することなくフィルタリングできます。たとえば、すべてのPDFファイルは「PDF」などの値を「のFileType」という名前のメタデータフィールドを持っていると言う、検索URLは、このための解決策を見つけるか

...&q=<what user searched>&requiredfields=FileType:PDF

関連する問題