2017-11-24 5 views
0

文章とラベルのあるファイルのサンプルがあります。どのように文とラベルに分割できますか?文章とラベル付きのPythonの分割線

非常に、非常に、非常に、非常にゆっくりと動き、漂流する若い男についての無意味な映画。 0

誰がもっと迷子になったのかわかりません。フラットなキャラクターや聴衆は、半数近くが出かけました。 0

白と巧妙なカメラアングルで黒を浮かべていると、映画は失望していました。演技が悪く、プロットやラインがほとんど存在しないため、ムービーはもっとばかげたものになりました。 0

話すことがほとんどない音楽。文章の0

出力
リスト:
[「非常に、非常に、非常に動きの遅い、悩んで、漂流若い男についての目的のない映画」より多くの失われたことを確認、 "ありません - 'ラベル対応]


[' フラット文字や観客の半数近くが出て歩い0' 、 '0']

+0

分割して文章とラベルに分割するとどういう意味がありますか?それらを別々のファイルに保存しますか?おそらく出力形式の例ではわかりやすいものになるでしょう。 – oldmonk

+0

すべてのラベル{0}を別々に保存する必要があります。 – avinash

+0

テキストとラベルを別々のリストに分割する答えを追加しました。ご確認ください – oldmonk

答えて

1

。これらのリストのデータは、要求されたときとは別にファイルに書き込むことができます。

fmov=open('yourdata.txt','r') 
sentence_list=[] 
label_list=[] 
for f in fmov.readlines(): 
    lineinfo=f.split('.') 
    sentenceline=".".join(lineinfo[0:-1]) 
    sentence_list.append(sentenceline) 
    label_list.append(str(lineinfo[-1]).replace('\n','')) 
print(sentence_list) 
print(label_list) 

OUT: 
['A very, very, very slow-moving, aimless movie about a distressed, drifting young man', 'Not sure who was more lost - the flat characters or the audience, nearly half of whom walked out', 'Attempting artiness with black & white and clever camera angles, the movie disappointed - became even more ridiculous - as the acting was poor and the plot and lines almost non-existent', 'Very little music or anything to speak of'] 
[' 0', ' 0', ' 0', ' 0'] 
+0

あなたのコードで 'flake8'を実行してください。 PEP8(https://www.python.org/dev/peps/pep-0008/)では、 'sentence_list'や' label_list'のような識別子を使用するように求めています。 –

+0

@J_Hありがとう、私はflake8について知りませんでした。識別子名を編集しました – oldmonk

0

が '0' のラベル? 1文だけの場合は、ピリオドを区切り文字として使用してstring.split('.')を実行することができます。あなたが「Mr.」のような文を持っているなら、これはいくつかの誤りを犯すかもしれませんが、または '夫人' if文を追加する必要があるかもしれません。ファイル 『yourdata.txt』に格納された次のコードは2つのリストsentence_list及びlabel_listを生成しなければならない場合、最後の後に「」(ドット)数が所定例えばレーベル

であると仮定すると

関連する問題