named-entity-recognition

    4

    1答えて

    NLTK名前付きエンティティタグを使用して、さまざまな名前付きエンティティを識別しようとしています。本書ではPythonでの自然言語処理には、DATE June、2008-06-29とTIMEの2つの50分、1:30 p.m.を含む一般的に使用される名前付きエンティティのリストが提供されています(誰かが好奇心を持っている場合は、表7.4)。だから、NLTKの名前付き実体タグ・タグでこれを行うことが

    5

    1答えて

    私は医学テキスト用の半自動注釈ツールを開発しています。注釈のためにRDFトリプレットを見つけるのは完全に迷っています。 現在、NLPベースのアプローチを使用しようとしています。私はすでにStanford NERとOpenNLPを調べましたが、どちらも病名抽出モデルはありません。 私の質問は *病名を抽出するための新しいNERモデルを作成するにはどうすればよいですか? OpenNLPまたはStand

    6

    3答えて

    私は病気を記述するテキスト文書をたくさん持っています。これらの文書はほとんどの場合非常に短く、しばしば単一の文のみを含む。例がここで与えられる: 原発性肺高血圧症は、最も小さい肺動脈の広範な閉塞が肺血管抵抗の増加につながり、続いて右心室失敗した進行性疾患です。私は必要なもの は文章で(この場合、例えば、「肺高血圧症」)は、すべての病気の用語を検索し、MeSHなどの統制語彙にマッピングするツールです

    6

    1答えて

    openNLP NameFinderモジュールで使用されるアルゴリズムを指摘できますか? コードは複雑であり、まばらに文書化されていて、ブラックボックス(デフォルトのモデルが提供されている)として再生すると、ほとんどの場合ヒューリスティックな印象を受けます。 ここでは、入力と出力のためのいくつかの例は次のとおりです。 入力: ジョン・スミスがイライラしています。 john smithが不満です。

    7

    1答えて

    オランダ語から名前付き実体を抽出しようとしています。私はnltk-trainerを使用して、conll2002 dutch corpusのタグャーとチャンクをトレーニングしました。ただし、チャンクの解析メソッドは名前付きエンティティを検出していません。ここに私のコードは次のとおりです。 str = 'Christiane heeft een lam.' tagger = nltk.data.l

    35

    3答えて

    NLTKを使用してテキストから名前付きエンティティを抽出しようとしています。私はNLTK NERが私の目的にとってあまり正確ではないことを知り、自分のタグをいくつか追加したいと思います。私は自分のNERを訓練する方法を見つけようとしてきましたが、適切なリソースを見つけることができないようです。 私はNLTKで固有表現認識器を訓練するために自分のデータをNLTK- に関する質問のカップルを使用するこ

    5

    3答えて

    私は、テキスト解析とエンティティの抽出を行うライブラリを探しています。 エンティティのタイプ/分類は重要ではありません。それは重要な価値のあるものの識別です。この場合のエンティティユニバースは無限で、固定ディクショナリで囲まれていません。 NERDは、これらのWebサービスの結果を比較できるようにするいくつかのWebサービスがあるようです:http://nerd.eurecom.fr/docume

    24

    3答えて

    テキストメッセージから場所、日付、時刻を抽出するためにNLTKツールキットを使用しようとしています。私はちょうど私のマシン上にツールキットをインストールし、私はそれをテストするためにこのクイックスニペットを書いた: sentence = "Let's meet tomorrow at 9 pm"; tokens = nltk.word_tokenize(sentence) pos_tags =

    14

    1答えて

    私はpynerライブラリを使ってスタンフォードNERを使っています。 1つの基本的なコードスニペットがあります。 import ner tagger = ner.HttpNER(host='localhost', port=80) tagger.get_entities("University of California is located in California, United Sta

    5

    2答えて

    私は請求書と請求書のコレクションを持っているので、テキストに文脈はありません。 私はそれらの請求書から人名を抽出したいと思います。 私はOpenNLPを試しましたが、私にはコンテキストがないので、訓練されたモデルの品質は良くありません。 最初の質問は次のとおりです。モデルをトレーニングするには、コンテキストなしの人名のみが含まれていますか?それが可能であれば、私が新しいモデルを構築する方法について