nlp

3熱

1答えて

薬の説明を格納するテーブルから、各エントリの製品名、強度、製品の数量、製薬会社を特定する必要があります。目標は、あらかじめ定義された構造を持つテーブルのコピーを持つことです。現在のテーブル：正規化されたテーブル：これまでのところ、私は自然言語処理の少し読んだが、私は別のアプローチを知りたいです。私はRegexを使うことを考えていましたが、多くの場合があります。あらゆる種類の洞察が認められる

-1熱

1答えて

アラビア語などの他の言語のCoreNLP

CoreNLPを使用しています。私は英語のために正常に実行しました。私はアラビア語のような他の言語でも同じことをする必要があります。システムをトレーニングして他の言語に使用する方法を教えてください。

1熱

1答えて

nltk.RegexpParser文法を組み合わせる

NLPについてもっと学ぶための次のステップとして、単純なnグラム以上の結果を改善する簡単なヒューリスティックを実装しようとしています。以下にリンクされているスタンフォード・コロケーションのPDFによれば、「フレーズ」である可能性が高いパターンを通過させる部分の音声フィルタを通して「候補語句」を渡すことは、バイグラムoccuring 出典：コロケーション、ページ143から144：https://n

1熱

1答えて

ngramを適用する前に入力テキストを理解する最善の方法

現在、私はexcelファイルからテキストを読み込み、bigramを適用しています。 finalListは、以下のサンプルコードで使用されているリストを持っていますの入力ワードから読み取られたリストは入力エクセルファイルです。私は、エンドツーエンドを完了：言葉 bigram=ngrams(finalList ,2) 入力テキストの入力テキストのリストに適用さ from nltk.corpus i

0熱

1答えて

Imdbレビューのエンコーディングエラー

レビューを肯定的または否定的な感情に分類するRNNモデルを構築しようとしています。辞書のボキャブもあり、前処理でインデックスのシーケンスを確認します。私は頻繁にvocabsを取得し、その内容を確認しようとするとは例えば、 "This movie was best" --> [2,5,10,3] は、私はこのエラーを得た： num of reviews 100 number of unique

0熱

1答えて

Rスローのステマー関数

データセット（data.tableパッケージを介してアップロードされた）のステマー関数を約40000行のRで実行しようとしていますが、それは永遠に実行されます。私のコードは次のようになります。プロセスを手動で停止した場合、それはのように50回の以上の警告を示し data[, Description := map(Description, function(k) stemmer(k))] ： I

0熱

1答えて

機能は

キーワード次のコードは、なしのキーワードを返して： - 私は取得しています from rake_nltk import Rake r=Rake() testscenario='''This document is very important as it has a lot of business objectives mentioned in it.''' defect='''Curre

0熱

2答えて

自然言語処理（syntatctic、セマンティック、progmatic）分析

は私のテキストは、テキストが含まれている= はを「ラヴィはラグーを叩解」私の質問は、だろう「ラグーを叩解？」回答は、自然言語処理によってこれを行うにはどのようにNLP 使用「ラヴィ」に来るべきです。 Pythonを使用した構文、意味、およびプログラマティックな分析でこれを進めてください。

2熱

1答えて

PostgreSQLのto_tsvector関数は字句ではなくトークン/単語を返すことができますか？

PostgreSQLのto_tsvector機能は非常に便利ですが、私のデータセットに関しては、私が望んでいる以上に少しだけ機能します。例えば： select * from to_tsvector('english', 'This is my favourite game. I enjoy everything about it.'); は生成：'enjoy':7 'everyth':8

0熱

1答えて

スタンフォードパーサーを使用したセンテンス生成

スタンフォードパーサーを使用して同様の種類のセンテンスを生成しようとしています。手順： 1.スタンフォードライブラリを使用して入力文を入力します。解析された文 3.Replaceから 2.Generate生産ルールいくつかの端末値 I三の疑問を持ってnltk.parse.generate から（）関数を生成使用4.Regenerate文： 1.StanfordParserは常に有限生成ルールを生