フレーズがテキスト文字列であるかどうかをチェックし、辞書値を1にして3つのフレーズを繰り返します。私のコードはうまくいきますが、私はもっと短い解決策があると確信していますが、見つけられないようです。文字列に文字列が含まれているかどうかをチェックする単純なpythonソートdict値
self.results['p1_txt'] = self.results['p2_txt'] = self.results['p2b_txt'] = self.results['p3_txt'] = 0
if "phase_1" in self.results['text']:
self.results['p1_txt'] = 1
if "phase_2" in self.results['text']:
self.results['p2_txt'] = 1
if "phase_2b" in self.results['text']:
self.results['p2b_txt'] = 1
if "phase_3" in self.results['text']:
self.results['p3_txt'] = 1
を...それは使用する方が理にかなってあります'True'と' False'を '1'の代わりに使うか、単に' 'フレーズのセットを作るだけです。 – byxor
テキストからフィーチャを作成し、NLP分析のためにデータベースに格納しています。私はT/Fの使用を検討しましたが、バイナリの考え方はラインを助けるかもしれません。 – pheeper