文章を解析する必要があります。 「アリスは少年です。 ['Alice'、 'boy']と に、 "象は哺乳類です" ['elephant'、 'mammal']に変換する。意味私は文字列を 'is'で分割し、 'a/an'も削除する必要があります。 これを行うにはエレガントな方法がありますか?正規表現を使用して文章を解析するには
答えて
、あなたはre.search
を使用して、このようにそれを行うことができます。
print(re.search('(\w+) is [a|an]? (\w+)',"Alice is a boy.").groups())
# output: ('Alice', 'boy')
print(re.search('(\w+) is [a|an]? (\w+)',"An elephant is a mammal.").groups())
# output: ('elephant', 'mammal')
# apply list() if you want it as a list
この答えは、正規表現の私たちを行いますが、物事の一つの方法ですされていません。
s = 'Alice is a boy'
s = s.split() # each word becomes an entry in a list
s = [word for word in s if word != 'a' and word !='an' and word !='is']
これに対する主な欠点は、あなたがリストに除外したいすべての単語をリストする必要があるだろうということです理解。あなたは正規表現を使用して主張している場合は
「象は哺乳動物です」という例はどうですか?また、あなたは完全な停止を忘れました。 –
{'a'、 'an'、 'is'} 'の中の単語でない場合、単語内の単語は簡単です –
これは本当ですが、この方法は完全な停止を説明していません。文字列パッケージで 'translate'メソッドを使用することを考慮することができます。 – Windmill
- 1. は、私は正規表現を使用して次の文を解析する正規表現
- 2. 正規表現を使用してテキストファイルを解析する
- 3. 解析用にSplunkを使用して、データと正規表現
- 4. は、正規表現を使用してテーブルを解析 - Javaの
- 5. 正規表現とハイパーリンクを解析する正規表現
- 6. エスケープ文字で正規表現を解析する正規表現
- 7. 正規表現の解析文字列
- 8. エラー?!。正規表現の構文解析 `(`
- 9. 正規表現の構文解析 - ファイル
- 10. 正規表現の構文解析
- 11. 正規表現構文解析Double
- 12. 正規表現で文字列を解析するには?
- 13. ログを解析する正規表現。
- 14. PHP、正規表現、解析用のゲームログ
- 15. Parsecを使って正規表現を解析する
- 16. 正規表現を使ってPerlの行を解析する
- 17. 正規表現を使用してテキストファイルからSQLコマンドを解析するC#
- 18. Ruby正規表現を使用して数値を解析する
- 19. Apacheブタ、正規表現を使用して結合ログを解析する
- 20. 正規表現を使用してシェルスクリプトでJSONを解析する
- 21. PHPの正規表現を使用してXMLを解析する
- 22. 正規表現でXML文字列を解析する
- 23. javascriptの文字列を正規表現で解析する
- 24. JSフレンドリ正規表現で文字列を解析する
- 25. ActionScript3でタイムスタンプ文字列を解析する正規表現
- 26. C#正規表現を解析する正規表現/simple1/1.2-SNAPSHOT/
- 27. 正規表現をHTMLコードから解析するための正規表現
- 28. CSS表現を正規表現で解析する
- 29. 正規表現を短い配列として解析する
- 30. 正規表現で正規表現の文字列を解析することは可能ですか?
あなたはコードであなたの試みを投稿することができますか? –
文章の形式は何ですか? –
[stopwordsを削除する](http://stackoverflow.com/questions/5486337/how-to-remove-stop-words-using-nltk-or-python)が必要で、簡単な分割で残りの部分を取得する必要があります。 –