私は匿名のテキストを探していますが、タスクの1つは参照されている人の性別への参照を削除することです。少しでも意味が失われてもそれは問題ありませんが、それは好ましくありません(実際には自動化されます)。単語の性別を判断する
彼/彼女/彼/彼女のような言葉は、参照されている人の性別を暗示します。これらは私が探している言葉です。
これらの単語のいずれかが与えられれば、私は正規化することができます(単語のうちの1つを選択するだけである可能性があります)が、最初にそれらを識別できる必要があります。
私の素朴な考えは、ジェンダーを指定する定義を持つ単語を辞書から検索することでした。それは動作しますが、かなり騒々しいです。
性別に特有の単語(英語)やそれを特定するための(好ましくは自動化された)方法を判断する方法はありますか?
[English Language&Usage](http://english.stackexchange.com/)をお試しください。このサイトはプログラミング上の問題のためのものです。 – Mick
私もそこで試してみますが、これは*これを自動化することに関する質問です。私はその質問を言い換えるつもりです。 – robertlayton
http://www.nltk.org/book/ch06.html#gender-identification – alvas