Pythonでdefaultdict(list)を反復処理するにはどうすればよいですか? Pythonでリストの辞書を使用するより良い方法はありますか? 私は通常のiter(dict)
を試みたが、私はエラーが持っている:Pythonでdefaultdict(list)を反復処理する方法は?
>>> import para
>>> para.print_doc('./sentseg_en/essentials.txt')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "para.py", line 31, in print_doc
for para in iter(doc):
TypeError: iteration over non-sequence
メインクラス:
import para
para.print_doc('./foo/bar/para-lines.txt')
para.pyc:
# -*- coding: utf-8 -*-
## Modified paragraph into a defaultdict(list) structure
## Original code from http://code.activestate.com/recipes/66063/
from collections import defaultdict
class Paragraphs:
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
# Separator here refers to the paragraph seperator,
# the default separator is '\n'.
def __init__(self, filename, separator=None):
# Set separator if passed into object's parameter,
# else set default separator as '\n'
if separator is None:
def separator(line): return line == '\n'
elif not callable(separator):
raise TypeError, "separator argument must be callable"
self.separator = separator
# Reading lines from files into a dictionary of lists
self.doc = defaultdict(list)
paraIndex = 0
with open(filename) as readFile:
for line in readFile:
if line == separator:
paraIndex+=1
else:
self.doc[paraIndex].append(line)
# Prints out populated doc from txtfile
def print_doc(filename):
text = Paragraphs(filename)
for para in iter(text.doc):
for sent in text.doc[para]:
print "Para#%d, Sent#%d: %s" % (
para, text.doc[para].index(sent), sent)
例えばを
This is a start of a paragraph.
foo barr
bar foo
foo foo
This is the end.
This is the start of next para.
foo boo bar bar
this is the end.
メインクラスの出力は次のようになります:このような./foo/bar/para-lines.txt
ルックスの
Para#1,Sent#1: This is a start of a paragraph.
Para#1,Sent#2: foo barr
Para#1,Sent#3: bar foo
Para#1,Sent#4: foo foo
Para#1,Sent#5: This is the end.
Para#2,Sent#1: This is the start of next para.
Para#2,Sent#2: foo boo bar bar
Para#2,Sent#3: this is the end.
私は 'for'ループから抜け出すと、' paragraph'が範囲外になってしまうでしょうか?どのように段落を保持し、 'itertools.groupby'ループの外でそれにアクセスし続けますか? – alvas
いいえ、 'paragraph'という名前は範囲外に出ません。 Pythonは、関数のためだけに、 'with'や' for'のようなブロック構造の新しいスコープをオープンしません。 – kindall
'paragraph'はループのたびに新しい値に再割り当てされます。古い段落を残しておきたい場合は、 'paragraphs = []'リストをループの外側に定義し、各段落を 'paragraphs.append(paragraph)'ループの中に追加することができます。 – unutbu