corpus

    0

    1答えて

    私は問題を抱えています。私が達成しようとしていることをまとめておきます。 私はコーパスにmovie_reviewはわずか2つのカテゴリに持っていたが、どこ私の場合のように、私は複数のカテゴリとサブカテゴリを持つことになりますをmovie_reviewsに似何かを作成したいです。例えば : は私が は、 'A'、 'B'、 'C​​'、 'D' と 'E' のようなカテゴリを作成したかったmy_co

    -1

    2答えて

    私はquantedaを使用してテキストコーパスを作成し、メタデータを添付しようとしていますが、エラーが発生し続けます。以前このコードを別のデータセットで使用しましたが、何らかの理由で現在のデータセットでは機能しません。コードは次のとおりです。 dfm.ineq1 <- corpus(df.ineq$speech, docnames=df.ineq$speechID,

    0

    1答えて

    NLTK茶色コーパスとPOSタグへのインターフェースを有しており、それは以下のようなアクセスできます >>> from nltk.corpus import brown >>> brown.tagged_sents() [[(u'The', u'AT'), (u'Fulton', u'NP-TL'), (u'County', u'NN-TL'), (u'Grand', u'JJ-TL'), (

    -1

    1答えて

    同じフォルダ内にcats.txtというファイルとカテゴリが多数表示されています。私はこれのための分類タグ付き読者を作成したいと思う。 これは私のファイルの見た目です。 nltkでさまざまな方法を試してみましたが、カテゴリ化されたタグ付きコーパスリーダーの作成に失敗しました。私のcats.txtの中にファイル名とカテゴリ名をスペースで区切って、各ファイル名に複数のカテゴリがあります。例えば : ma

    1

    3答えて

    に作成するdate,bodyおよびtitleにグループ化されたテキストを含むいくつかのJSONファイルがあります。一例として考えてみます。 {"date": "December 31, 1990, Monday, Late Edition - Final", "body": "World stock markets begin 1991 facing the threat of a war in

    0

    1答えて

    このコードは、nltkライブラリのword.words()内のすべての単語をループし、単語を配列にプッシュします。次に、配列内のすべての単語をチェックして、同じライブラリを使用して実際の単語であるかどうかを確認します。何らかの形で多くの単語が「adighe」のように実際ではない奇妙な単語です。何が起きてる? import nltk from nltk.corpus import words

    0

    1答えて

    私は32ビットの制限のために3Gbしかアクセスできない4GbのRAMを備えた32ビットオペレーティングシステムでWindows 7を使用しています。私はそれ以外のものをすべてシャットダウンし、私は約1Gbをキャッシュし、1Gbを使用可能にしていることがわかります。 quantedaの使用 - 私は、157MbのcorpusSourceオブジェクトを正常に作成するtextfile()コマンドを使用し

    0

    1答えて

    私は、これがコーパスであるかどうかに関わらず、どのデータフレームからも最初のN文字を取得するのに似ていると推測しています。 私の試み: create.greetings <- function(corpus, create_df = FALSE) { for(i in length(Charlotte.corpus.raw)) { Doc1<-Charlotte.corpus.

    1

    1答えて

    私はnltkにVerbNetコーパスが含まれていることを知っていますが、Unified Verb Indexはその情報と他の3つの有用な情報源を結合しています。このコーパスをPythonで使用する方法はありますか?

    0

    2答えて

    私はnltkを初めて利用しています。 synsets、hypernyms、​​などがありますが、「デリー」 - 「ハイデラバード」のような場所間の類似性は、明らかにこれらの単語がワードネットコーパスに含まれていないためはありません。 なので、何とか私がwordnet corpusを更新するか、wordnetを別のコーパスで作成できるかどうかを知りたいと思います。旅行に関連するウィキペディアから抽出