2016-09-21 13 views
0

私は匿名のテキストを探していますが、タスクの1つは参照されている人の性別への参照を削除することです。少しでも意味が失われてもそれは問題ありませんが、それは好ましくありません(実際には自動化されます)。単語の性別を判断する

彼/彼女/彼/彼女のような言葉は、参照されている人の性別を暗示します。これらは私が探している言葉です。

これらの単語のいずれかが与えられれば、私は正規化することができます(単語のうちの1つを選択するだけである可能性があります)が、最初にそれらを識別できる必要があります。

私の素朴な考えは、ジェンダーを指定する定義を持つ単語を辞書から検索することでした。それは動作しますが、かなり騒々しいです。

性別に特有の単語(英語)やそれを特定するための(好ましくは自動化された)方法を判断する方法はありますか?

+0

[English Language&Usage](http://english.stackexchange.com/)をお試しください。このサイトはプログラミング上の問題のためのものです。 – Mick

+0

私もそこで試してみますが、これは*これを自動化することに関する質問です。私はその質問を言い換えるつもりです。 – robertlayton

+0

http://www.nltk.org/book/ch06.html#gender-identification – alvas

答えて

1

このタスクを自動化するために使用するプラットフォーム/言語/ソフトウェアについてご存知ですか?

例えば、Gateプラグインを試してみてください。Pronoun Annotator

代名詞に性別を付けることができます。それはあなたの仕事であなたを助けることができます。

+0

をご覧ください。ありがとうございます。私はPythonを使用しますが、リストを生成するためには、それは本当に重要ではありません。 – robertlayton