2017-01-10 1 views
0

私は初心者のコーダーで、さまざまな文字列を分離するためにソースファイルからすべてのJavaScriptを取り除くスクリプトを作成しようとしています。Pythonでさまざまな文字列を分離するために無関係なコードをトリミングするにはどうすればよいですか?

I.E.私はこのコード

terms[1] = "affect heuristic"; 

defs[1] = "The mental shortcut of addressing a question as "How do I feel about this?" instead of "What do I think about this?""; 
media[1] = ""; // Media Array 
term_audio[1] = ""; // Term_Audio Array 
images[1] = ""; // Images Array 

     // 
terms[2] = "agonism"; 

defs[2] = "Defending one's own survival interests against other organisms."; 
media[2] = ""; // Media Array 
term_audio[2] = ""; // Term_Audio Array 
images[2] = ""; // Images Array 

を持っていると私は引用符内の用語や定義を除き、離れて、すべてを取り除くと、n個の用語と定義を含むリストに適用することができるようにしたいので、出力は

になり

ヒューリスティックに影響する、質問に対処するための精神的なショートカット"これについてどう思いますか? "の代わりに"これについてどう思いますか? "

アゴ、ここで定義、

n番目の用語、n番目の定義

は、私はこれをどのように行うのでしょうか?

ありがとうございました!

マット

答えて

0

あなたはこれを達成するために正規表現を使用することができます。

>>> import re 
>>> 
>>> input_str = """ 
... terms[1] = "affect heuristic"; 
... 
... defs[1] = "The mental shortcut of addressing a question as "How do I feel about this?" instead of "What do I think about this?""; 
... media[1] = ""; // Media Array 
... term_audio[1] = ""; // Term_Audio Array 
... images[1] = ""; // Images Array 
... 
...   // 
... terms[2] = "agonism"; 
... 
... defs[2] = "Defending one's own survival interests against other organisms."; 
... media[2] = ""; // Media Array 
... term_audio[2] = ""; // Term_Audio Array 
... images[2] = ""; // Images Array 
... """ 
>>> 
>>> res = re.sub(r'".*"', '', input_str) 
>>> print(res, sep='\n') 

terms[1] = ; 

defs[1] = ; 
media[1] = ; // Media Array 
term_audio[1] = ; // Term_Audio Array 
images[1] = ; // Images Array 

     // 
terms[2] = ; 

defs[2] = ; 
media[2] = ; // Media Array 
term_audio[2] = ; // Term_Audio Array 
images[2] = ; // Images Array 

>>>