information-extraction

    0

    1答えて

    私は現在、件名とオブジェクトタイプにのみNameEntitiesが含まれている関係トリプル(主語、述語、オブジェクト)のためCoreNLPオープン情報抽出(OpenIE)で検索しています。しかし、List<CoreMap>のオブジェクトRelationTripleのエンティティタイプを取得する方法はわかりません。私は助けを感謝されるRelationTripleクラスからエンティティタイプを取得する

    1

    1答えて

    Discrete-State Variational Autoencoders for Joint Discovery and Factorization of Relations論文の著者によると、this datasetの最初のフィールドは、訓練センテンスのエンティティのペアの間の字句依存の依存パスです。 特定のエンティティのペアを持つ文からどのようなツール(できればPythonで)がそのよう

    0

    1答えて

    pdfファイルのいくつかの一般的なプロパティを抽出したいと思います。これまでのところ、これは非常にうまくいっています。ただし、新しい入力ファイルを試してみると、私は今、奇妙な新しいエラーに遭遇しました。 解析のために、私はpdfminer.sixを使用しています。 、今 pdf_data = { 'Number of words': len(words), 'Number of

    0

    1答えて

    記事全体を保存せずに処理すると、ウィキペディア記事の特定の単語の頻度をどのように得ることができますか?たとえば、この記事では「インド」という言葉がどのように表示されるのでしょうか。https://simple.wikipedia.org/wiki/India

    0

    2答えて

    イベントの説明テキストがいくつかあります。 イベントの入場料を引き出したいと思います。 入場料が条件付きであることがあります。 私が達成したいのは、入場料とその条件(利用可能な場合)を抽出することです。入場料+その条件を示すフレーズや文章全体を検索するのは大丈夫です。 注I:テキストはドイツ語で書かれています。注意:ほとんどの場合、文章は主にイベントチラシまたは広告であるため、完全ではありません。

    1

    2答えて

    私はテキストの塊から場所を抽出しようとしている(NER/IE)とは、多くのソリューションあまりにもinnaccurateスペイシー、スタンフォードなどなど すべてであるすべてを試してみました実際に私のデータセットでは80-90%正確です(spacyは70%のようでした)、私が持っている別の問題はこれらのエンティティのための何かを意味する確率がないため、私は信頼を知らず、それに応じて進めることができ

    1

    2答えて

    特定のタイプの情報を抽出するための情報抽出のコーパスを構築していますが、そのエンティティに注釈を付ける最も良い方法を決定しようとしています。私は、IEERコーパスがSGMLタグ要素ENAMEX,NUMEX、およびTIMEXタグを使用していることを発見しました(ここで説明されています:http://itl.nist.gov/iaui/894.02/related_projects/muc/proce

    -1

    1答えて

    私は、もしあれば、Twitterのテキストから有名人を抽出する必要があるプロジェクトに取り組んでいます。私は箱からこれを行うライブラリを見つけることができません。 私は、ユーザープロフィールに有名人のために検証されたブール値フィールドがあるという情報を得ました。 提案がありますか?

    3

    1答えて

    私は文をとり、Person(PER)とPlace(GPE)の関係を抽出しようとしています。 センテンス「ジョンはオハイオ出身、マイケルはフロリダ出身、レベッカはテネシー州ナッシュビル出身です」 最終的な人物のために、彼女は彼女の場所として抽出できる都市と州の両方を持っています。これまでは、nltkを使ってこの作業を試みましたが、彼女の状態ではなく、彼女の都市を抽出することしかできませんでした。 私