2016-09-06 8 views
1

私は現在、必要な単語のみを含むようにレキシコン/辞書をフィルタリングしようとしています。辞書には2つの列が最初にあり、2番目の列は表音発音です(下の画像を参照)。1列目と2列目の間のスペースを同じにする方法

Snippet of lexicon

辞書はhere可能です。

このスペース/デリミタをすべてのケースでも作成できる方法はありますか?もっと簡単になります。

+2

をすることができますイースリーファイルの行do'forので、 ( '\ t') 'にアクセスし、' values [0] 'と' values [1] 'の音韻的な単語にアクセスして –

+0

oh ..私は馬鹿だと感じます。それは私の問題を解決した。どうもありがとう –

答えて

0

あなたは次のような意味ですか?この場合here

が、これは(特定の文字を使用せずに)コードです:値= line.split:、このスペースはタブです

#!/usr/bin/env python2 

import sys 

path_to_the_file = sys.argv[1] 

word = [] 
pron = [] 
maxword = 0 
with open(path_to_the_file) as fr: 
    for line in fr: 
     words = line.split() 
     word.append(words[0]) 
     pron.append(' '.join(words[1:])) 
     if len(words[0]) > maxword: maxword = len(words[0]) 

format_str = '{:'+str(maxword)+'s} {:s}\n' 

msg = '' 
for w,p in zip(word,pron): 
    msg += format_str.format(w,p) 

print msg 
関連する問題