さまざまな長さのステム単語のカスタムリストへの一致をPythonリストから検索します。

私は、pythonを使用してカスタムステム単語の単語トークン化抄録を検索しようとしています。次のコードは、ほとんど私が欲しいものです。つまり、stem_wordsの値のいずれかがword_tokenized_abstractに1回以上表示されますか？さまざまな長さのステム単語のカスタムリストへの一致をPythonリストから検索します。

if(any(word in stem_words for word in word_tokenized_abstract)): 
    do stuff

...

stem_wordsのみ
word_tokenized_abstractは私がone-liner to check if at least one item in list exists in another list?

で上記をベースのみ

文字列のリストである文字列のリストであります私の問題は、私のstem_wordsの長さが違うことです。私は私のためにはうまくいかなかった上記のコードを試しました。私はいくつかの変更を試みましたが、動作しないか、クラッシュする可能性があります。

if(any(word in stem_words for word[0:len(word)] in word_tokenized_abstract)): 
    do stuff

、stem_wordsの値のいずれかで始まるword_tokenized_abstract値のいずれかを実行していること？

それが助け場合、私のstem_words = ['pancrea', 'muscul', 'derma', 'ovar']

ありがとう！私はこの質問が以前に答えられたが、それを見つけることができなかった場合、謝罪します。

したがって、最初のリストの文字列が2番目のリストの文字列に含まれているかどうかを確認する必要があります。

私はこれ試してみた：word_tokenized_abstractのいずれかの文字列がxで始まっている場合stem_wordsチェックで各幹xについて：

any(y.startswith(x) for y in word_tokenized_abstract for x in stem_words)

は説明。

あなただけのステムは、単語の部分文字列になりたい場合は、使用します。

any(x in y for y in word_tokenized_abstract for x in stem_words)

2017-05-09 16:39:10 user2314737

ありがとうuser2314737を！それはまさに私が必要としたものです（startswithメソッドを含む）。そして、すばやく返信いただきありがとうございます。 –

答えて