-1
問題作成:ワード位置の文書インデックス
私はPythonでデータ構造を作成することにより、インデックス作成を実行する指定されたテキストファイルからすべての単語を格納しますし、またその行番号を格納します(すべてのそれらの単語が現れる行)とその特定の行の単語(column#)の位置も表示されます。
これまでのところ、すべての行番号をリストに追加して辞書に単語を格納することはできましたが、特定の行にその位置を保存することはできません。
テキストファイルの検索を高速化するには、このデータ構造が必要です。
は、ここまでの今までの私のコードです:ここで
from collections import defaultdict
thetextfile = open('file.txt','r')
thetextfile = thetextfile.read()
file_s = thetextfile.split("\n")
wordlist = defaultdict(list)
lineNumber = 0
for (i,line) in enumerate(file_s):
lineNumber = i
for word in line.split(" "):
wordlist[word].append(lineNumber)
print(wordlist)
のフォーマットが何でありますかあなたのテキストファイル? – Leonid
@レオニード、それはどんなフォーマットでもかまいません。 –
@EdwinvanMierlo、私はPythonの初心者です、私はうまくいっていません。 –