私は、pythonでテキストファイルから単語を分割しています。私は行番号(c)とインデックス付きの辞書(word_positions)を受け取りました。次に、ゼロ行列(c、index)を作成します。ここでは、コードは次のようになります。Pythonの行列を移植する
from collections import defaultdict
import re
import numpy as np
c=0
f = open('/Users/Half_Pint_Boy/Desktop/sentenses.txt', 'r')
for line in f:
c = c + 1
word_positions = {}
with open('/Users/Half_Pint_Boy/Desktop/sentenses.txt', 'r') as f:
index = 0
for word in re.findall(r'[a-z]+', f.read().lower()):
if word not in word_positions:
word_positions[word] = index
index += 1
print(word_positions)
matrix=np.zeros(c,index)
私の質問:c
はmatrix[c,index] = count
、 - 行の数である、index
-theインデックス付きの位置とcount
の-the数:私はこれを取得することができるように行列を取り込むことができますどのように数えられた単語を連続してカウントする
それはあなたがやろうとしているかは明らかではありません。より多くの説明/簡単な例を追加できますか? – Amoss
'len(lines.split())'(各空白で文字列splitから作られた配列の長さ)を使用するだけで、単語の数を得ることができます – HolyDanna
私はテキストに22行と254のユニークな単語を持っています。だから、私の行列の大きさになります。そして、インデックス化されたユニークな単語ごとに、各単語の数を行数として数える必要があります。 – HalfPintBoy