テキストファイルに200個の名前のリストがあります。名前のすべての文字は小文字で、6文字または7文字から異なり、複数の見出しに分かれています。一部には小見出しがあります。私はスペースに基づいて分割しようとしますが、名前の各セクション間のスペースでテキストファイルを分割してしまいます。また、\n
も印刷されています。私は2つの異なるアイデアを持ち、両方にこだわっています。最後にテキストファイルを解析する
Header
subheading
namenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamename
Heading
Header
subheading
namenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamename
私は、ヘッダとサブヘッダ(すべて大文字の間で変動し、すべてのlowercaps、および両方のミックス)を無視し、名前だけを印刷しようとしています。すべてをリストとして追加しようとしましたが、テキストを正しく解析できないため、エラーが発生したり、各文字列の各文字を個別に印刷したりしていました。
path_to_file = 'pathgoeshere'
check_list = []
for word in open(path_to_file).read()
username = str(word)
check_list.append(username)
print username
List = open(path_to_file).readlines()
print List
for x in List:
user_name = str(x)
if user_name.lower():
print user_name
私の実際のコードでは、正しくフォーマットされていますが、これは私が探していたもののジストです。
最後に、私が必要としない無関係なテキストを数えずに解析し、名前を数えたいと思っています。
ここからどこに行くのかわかりません。
http://stackoverflow.com/help/someone-answersより大きいラインの各グループ –