2016-07-14 12 views
0

私はPythonには新しいです。私はテキストから仕事のタイトルを抽出する必要があり、名前エンティティの認識とデータの訓練のためのデータの訓練方法を知る必要があります名前エンティティの認識のためのNLTKでの新しいラベルの訓練方法

+0

まず、チュートリアルを検索して自分で試してみるべきだと思います。私たちはあなたのコードの問題を手伝ってくれるでしょうが、_for you_のコードは書きません。 –

+0

ここにルールベースのNERがありますが、非常にばかげていますが、楽しい=)https://gist.github.com/alvations/73bce71acf229265bc08 – alvas

答えて

0

名前付きエンティティレコグナイザや他のチャンクをカスタムカテゴリ(役職を含む)で訓練するには、関心のあるカテゴリで注釈を付けたコーパスが必要です。次にnltkの本、特にchunkingの7.2章を読んでください。 nltkでチャンクをトレーニングする方法を示します。

+0

ありがとうございました –

+0

よろしくお願いします。だからあなたの質問は今正確ですか? – alexis

+0

私が持っていた問題は、私たちは大量の履歴書を持っていました。たとえば、教師、ソフトウェア開発者などの仕事のタイトルを抽出する必要があります...私はこの助けをしましたtq –

関連する問題