2017-05-09 7 views
0

私は、pythonを使用してカスタムステム単語の単語トークン化抄録を検索しようとしています。次のコードは、ほとんど私が欲しいものです。つまり、stem_wordsの値のいずれかがword_tokenized_abstractに1回以上表示されますか?さまざまな長さのステム単語のカスタムリストへの一致をPythonリストから検索します。

if(any(word in stem_words for word in word_tokenized_abstract)): 
    do stuff 

...

文字列のリストである文字列のリストであります私の問題は、私のstem_wordsの長さが違うことです。私は私のためにはうまくいかなかった上記のコードを試しました。私はいくつかの変更を試みましたが、動作しないか、クラッシュする可能性があります。

if(any(word in stem_words for word[0:len(word)] in word_tokenized_abstract)): 
    do stuff 

stem_wordsの値のいずれかで始まるword_tokenized_abstract値のいずれかを実行していること?

それが助け場合、私のstem_words = ['pancrea', 'muscul', 'derma', 'ovar']

ありがとう!私はこの質問が以前に答えられたが、それを見つけることができなかった場合、謝罪します。

答えて

0

したがって、最初のリストの文字列が2番目のリストの文字列に含まれているかどうかを確認する必要があります。

私はこれ試してみた:word_tokenized_abstractのいずれかの文字列がxで始まっている場合stem_wordsチェックで各幹xについて:

any(y.startswith(x) for y in word_tokenized_abstract for x in stem_words) 

は説明。

あなただけのステムは、単語の部分文字列になりたい場合は、使用します。

any(x in y for y in word_tokenized_abstract for x in stem_words) 
+0

ありがとうuser2314737を!それはまさに私が必要としたものです(startswithメソッドを含む)。そして、すばやく返信いただきありがとうございます。 –

関連する問題