2017-08-04 3 views
-3

条第1項私はtxtに2つの段落を持っています。私は、PythonのNLTKに一般的にEコマースのように書か

電子商取引を使用して、両方の段落から一般的な単語を見つけなければならないなどのコンピュータネットワークを利用した商品やサービスに取引の売買または促進、ですインターネットまたはオンラインソーシャルネットワーク。電子商取引は、モバイルコマース、電子資金送金、サプライチェーン管理、インターネットマーケティング、オンライン取引処理、電子データ交換(EDI)、在庫管理システム、自動データ収集システムなどの技術を活用しています。それはまた、電子メールなどの他の技術を使用するかもしれないが

条第2項

現代の電子商取引は、一般的に、取引のライフサイクルの少なくとも一部のためのWorld Wide Webを使用しています。 eコマースのメリットとしては、アクセスのスピード、商品やサービスの幅広い選択肢、アクセシビリティ、国際的なリーチなどがあります。

私はあなたがset.intersectionを使用できる2つの段落の間に共通の言葉を見つけ、それらを

+2

これは宿題の質問のように聞こえるので、代わりに答えを提供するIあなたにヒントを与えるでしょう。 NLTKはこれを独自に行うことはできません.NLTkはそれが目的ではありません。しかし、あなたがしなければならないことは、NLTKのトークナイザを使って段落を単語に分割し、それらの単語をセットに入れて(例えば、提案された回答からの提案によって)比較することです。 –

+0

ステップ1. 'nltk.word_tokenize'、ステップ2:https://stackoverflow.com/questions/15173225/how-to-calculate-cosine-similarity-given-2-sentence-strings-pythonを参照するか、 http://web.stanford.edu/class/linguist236/materials/ling236-handout-05-09-vsm.pdf – alvas

+0

@BhatiManishKumar、あなたの名前を隠すためにユーザーIDを変更すると、警鐘も鳴ります。宿題に質問するのはこのサイトのルールに反するものではありません** ** ** ** **あなたは十分なヒントを持っていますが、今ではいくつかのPythonを学びます。 – alexis

答えて

0

を印刷する必要があります。

p1 = ''' 
Electronic commerce, commonly written as E-Commerce, is the trading or 
facilitation of trading in goods or services using computer networks, such 
as the Internet or online social networks. Electronic commerce draws on 
technologies such as mobile commerce, electronic funds transfer, supply 
chain management, Internet marketing, online transaction processing, 
electronic data interchange (EDI), inventory management systems, and 
automated data collection systems. 
'''.split() 

p2 = ''' 
Modern electronic commerce typically uses the World Wide Web for at least 
one part of the transaction's life cycle although it may also use other 
technologies such as e-mail. The benefits of e-commerce include it’s the 
speed of access, a wider selection of goods and services, accessibility, and 
international reach. 
'''.split() 

print(set(p1).intersection(p2)) 
{'and', 'the', 'technologies', 'of', 'electronic', 'such', 'commerce', 'as', 'goods'} 
+0

応答ありがとうが、これはnltkでこれが欲しい。あなたにもありがとう – BMK007

+1

@ BhatiManishKumar私は同じ結果を達成するためのNLTKメソッドを認識していません。 [ソース](https://github.com/nltk/nltk/blob/8eb3803cb88a6e75d18d4f740678b218b3d8f4fd/nltk/text.py#L107)をチェックすると、同様の結果を得るためにset.intersection()も頻繁に使用されます。 – umutto

1

あなたは言語処理に関してと特別な何かをする必要がない場合、あなたはNLTKを必要としない:

paragraph1 = paragraph1.lower().split() 
paragraph2 = paragraph2.lower().split() 

intersection = set(words1) & set(words2) 
+0

レスポンスありがとうございますが、これはnltkでお願いします – BMK007

+1

@BhatiManishKumarアラーム音を鳴らすような不当な制約を投げ始める瞬間、これはおそらく宿題やプロジェクトです。そうでなければ、50MBのライブラリをインストールして何かできることはありません簡単な設定交差点で達成する。あなたはここで援助を見つける可能性は低いです。 –

+1

@BhatiManishKumar、あなたの名前を隠すためにユーザーIDを変更すると、警告音が鳴ります。宿題に質問するのはこのサイトのルールに反するものではありません** ** ** ** **あなたは十分なヒントを持っていますが、今ではいくつかのPythonを学びます。 – alexis

関連する問題