corpus

    0

    2答えて

    NLTKを使用してテキスト内の単語を検索しています。一致関数の結果をリストに保存する必要があります。質問はすでにhere と尋ねられますが、私は変更を見ることができません。 type(text.concordance('myword')) 結果ました:私はによって機能のreturnde値の型を探してみてください <class 'NoneType'>

    1

    1答えて

    私がしたいのは、xmlのコーパスを読み込んでそれらをすべて追加することです。私はbaby-bnc(2553)で試してみましたが、これをプレーンテキストファイルに変換しましたが、full-bnc(2554)またはサンプラー(2551)を使用した場合、このエラーが表示され続けます。ValueError:concat 1つのオブジェクト! import nltk.corpus.reader.bnc as

    1

    1答えて

    私はちょうど仕事のためのデータセットモジュール外のデータでテキストチュートリアルを考えています。私はデータフレームからいくつかのテキストデータを取得し、これを作業用の文字列変数として格納しています。私はスペイシー少しで働いてきたし、私はこれが class 'spacy.tokens.doc.Doc だから私のことができるようにすべきであるが出力docオブジェクト nlp = spacy.loa

    0

    1答えて

    現在、私は与えられたテキストの位置情報を抽出し、最終的に所属する国を取得するというシナリオを持っています。例えば : I am studying in New York. 私は場所としてニューヨークをつかみ、何とかその所有者の国を見つけたいです。 スタンフォードNERパッケージでNLTKを使用しています。私は正常に位置を抽出することができます。そして、どうすればその国を得ることができますか(コ

    1

    1答えて

    Dundee Corpus(Kennedy et al。、2003)は、ダンディーツリーバンク(Barrett et al。、2015)と同様のトークン化と測定を備えたオープンアイトラッキングコーパスです。コーパスには、インディペンデントからの20の新聞記事を読んでいる英語を話す10人のネイティブの視線追跡記録が含まれています。 しかし、このデータはインターネットからは見つかりません。誰が私にこの

    0

    2答えて

    私は適切な名前を見つけるためにコーパスをクリーンアップしようとしています。どのように小文字をすべて削除するのですか? removeWords? gsub? doc.corpus <- tm_map(doc.corpus, removePunctuation) doc.corpus <- tm_map(doc.corpus, removeNumbers) doc.corpus <- tm_map

    0

    1答えて

    すべてのハッシュタグをマイニングしてTwitterデータを分析しようとしています。私はすべてのハッシュタグをコーパスに入れ、このコーパスを単語のリストにマッピングしたいと思います。この問題をどうやって管理できるか考えていますか? は、ここに私のデータのスナップは ここで私が使用されるが、私はここでスパース step1 <- strsplit(newFile$Hashtag, "#") step2

    0

    2答えて

    私はデータマイニングシステムに取り組んでおり、要件の1つはAPIを使用せずに分析を実行できることです。 Twitterデータベース(またはその大部分)をダウンロードしてローカルで使用する方法はありますか?

    0

    1答えて

    を許可されていない私は、次のダミーデータがあります。 final6 <- data.frame(docname = paste0("doc", 1:6), articles = c("Catalonia independence in matter of days", "Anger over Johnson Libya bodies comment",

    0

    1答えて

    こんにちは皆、 と日食に私はテリアのクイックスタートチュートリアルコーパスを経て、その後、私は以下のコードを実行します。 import java.util.Arrays; import org.terrier.indexing.Collection; import org.terrier.indexing.SimpleFileCollection; import org.terrier.st