word-count

    0

    1答えて

    私はSparkには新しく、Datasetクラスを使ってテキストファイルから機能(基本的には単語数)を抽出したいと思います。私は"Extracting, transforming and selecting features"のスパークに関するチュートリアルを読んだが、報告されたすべての例は「オンザフライ」で定義された単語の袋から始まる。私は、テキストファイルから始めて、同じ種類のデータセットを生成

    0

    1答えて

    私は自分のデータセットでstandford講義で述べたSVDメソッドを再現したいと思います。講義のスライドは、次の通りである 私のデータセットが生成され、CountVectorizerから処理 <13840x13840 sparse matrix of type '<type 'numpy.int64'>' with 597828 stored elements in Compressed Sp

    0

    1答えて

    マイHadoopのバージョンを与える削減です:2.8.1 私はApache Hadoop 2.8.0 WORDCOUNTソースコードであるMapReduceの例を実行しようとしていますようです以下私は上記のコードを挿入することによってWordCount.javaファイルを作成 import java.io.IOException; import java.util.StringTokenizer

    0

    1答えて

    私は、彼らが与えることができる最善の答えは、私は文字や単語の量をカウントすることで、辞書の定義をリスト(テキスト)ファイルで最長のエントリを見つけ出すことができプログラムが必要になるということである英語スタック所、"What is the English word with the longest single definition?"でオーバー尋ね指定されたエントリに格納し、次に最も長いエントリ

    -1

    1答えて

    私は大学のためにエッセイを書いています。私は合計ワード数に引用符で使用する単語を含めることはできません。 Wordにはこれを行う機能がないので、誰かがマクロを作成することで私を助けてくれることを期待していました。以前はマクロを使用していましたが、これほど複雑なものにはほとんど経験がありません。 私はすでにドキュメント全体で引用を処理するのに似た何かを持っているので、これらの両方を持つことは大きな助

    1

    2答えて

    ディレクトリ内のファイル数を最初に数え、各ファイル内で単語数を与えるという割り当てを実行しようとしています。私はファイル数は問題ありませんが、私はインストラクターが私に与えたコードを簡単な単語カウントに周波数カウントするクラスから変換するのに苦労しています。さらに、私は単語をカウントするために各ファイルを見るための適切なコードを見つけることができないようです(私は特定のテキストではなく "汎用のも

    0

    1答えて

    単語クラウドを構築する前に英語のストップワードをテキストから削除しようとしましたが、動作しませんでした。私はいくつかの記事を読んで、何も問題なく提案されたことを試しました。どんな助けもありがとう。 library(tm) library(wordcloud) library(RColorBrewer) library(SnowballC) textdata <- c(A secur br

    0

    1答えて

    誰かがコードスニペットの問題 lineStr= sc.textFile("/input/words.txt") print (lineStr.collect()) ['this file is created to count the no of texts', 'other wise i am just doing fine', 'lets see the output is there']

    -1

    1答えて

    を減らす - Javaコードや 2)をWordがハイブ 例:とカウント:以下の私のファイルは です Hello my name is Jammy Jammy is the best Jammy likes football 私は言葉「ジャミー」が登場..

    -1

    3答えて

    テキストファイル(file.txt)の内容を読み込んで、1文あたりの平均単語数を計算するPythonコードを書く必要があります。ファイルには1行に1つの文しか含まれていません)。 私はコーディングを行いました。私はそれが他の方法でもっと効率的かどうかを知る必要があります。百万円前もって感謝します。 # This program reads contents of a .txt file and c