NLPをとても使いやすくするすばらしいspaCy(https://github.com/explosion/spaCy)を発見しました。私は自分の研究のためにいくつかのNLP機能を抽出する必要があり、このツールを使用することで確実にプロセスが簡略化されます。しかし、私はTwitterの投稿から抽出された非公式のテキストを扱います。spaCyを使用してTwitterデータを処理できますか?
TwitterのNLPは、データの非公式でノイズの多い性質のため、異なるモデルを必要としているようです。 http://www.cs.cmu.edu/~ark/TweetNLPとhttps://github.com/aritter/twitter_nlpのようなツールが研究者によってリリースされました。しかしながら、それらはあまり使用可能でもスケーラブルでもありません。
spaCyがTwitterデータのNLPタスクに適しているかどうかは知りませんか?
ドキュメント内に情報が見つかりません。
事前に感謝します。
デビッド