2017-10-25 4 views
-2

人が書いたテキストから個人属性を抽出したいと考えています。例:テキストからの個人属性の抽出

私はいつもプロのサイクリングに興味があります。単一の母親であるため、スポーツを専門的に追求するのに十分な時間を見つけることは決して容易ではありませんでした。関心、女性:性別、スポーツ:関心、メルボルン:場所私は何ができる最高のは、私がサイクリングのようなものを抽出したいと思い、理想的な...メルボルンの美しいビーチに沿って短い乗車のために行く

ました。私はこれを名前付きエンティティ抽出といいますが、わかりません。私はStanford Named Entity Recognizerを試してみました。最も重要なことは、性別、年齢、関心事などの個人属性であり、さまざまなサンプルでこれらのほとんどを見逃していました。

これを行うのに役立つツール/ライブラリ(できればPythonで)はありますか?私はNLTKについて知っていますが、私はここでそれをどのように活用できるのか分かりません。

+0

このパッケージが役立つかどうかを確認してください... https://pypi.python.org/pypi/geograpy –

答えて

0

通常、スタンフォードの名前付きエンティティタグャーには、いくつかのデフォルトの分類子があります。一般的なタギングは'Name','Location','Organizations'のようにしかありません。他のタグ付けが必要な場合は、独自の分類子を訓練する必要があります。 this for create new classifierを参照できます。私はカスタムモデルを作成し、正常に動作しています。

関連する問題