2011-01-02 18 views
13

検索エンジンを作成しています(学習用)、Safesearch(http://en.wikipedia.org/wiki/Safesearch)でGoogleがアダルトコンテンツと画像をどのように認識しているかを知りたいと思います。Googleはsafesearchでアダルトコンテンツをどのように認識していますか?

プログラム言語は問題ではありません。一般的なプログラム言語のアプローチしか知りません。

+0

ローカライズされているため、これを閉じるために誰が投票しましたか?どのようにローカライズされていますか? – marcog

+0

言語が問題にならない場合は、なぜ2つの言語タグでこれをタグ付けしましたか? – sbi

+0

@sbi:*多分*これは彼が好きな言語です。私はそれらをretagするだろうが、私は彼の行動を待つことを好む;) –

答えて

2

私はそれが非常に複雑だと思います。

おそらくテキストでは、nまたはn%アダルト関連の単語以上のページをフィルタリングします。

画像では、各画像が見つかったページのファイル名と周囲のテキストを見て、大人の言葉でいっぱいであればそれをフィルタリングすることができます。彼らはまた、実際に肌の色調や裸の人物を探して画像をスキャンすることもできます。

関連する問題