Naive Bayesクラシファイアでopen（）文を使用すると長時間かかる

私は、3483行と460K文字と65K語のcsvファイルを持っていますが、このコーパスを使ってScikitでNaiveBayesクラシファイアを学習しようとしています。Naive Bayesクラシファイアでopen（）文を使用すると長時間かかる

問題は、この文を以下に使用すると、時間がかかりすぎる（1時間で終了しなかった）ことです。

from textblob import TextBlob 
from textblob.classifiers import NaiveBayesClassifier 
import csv 

with open('train.csv', 'r') as fp: 
    cl = NaiveBayesClassifier(fp, format="csv")

私は何を間違えていると思いますか？

ありがとうございます。

出典

2017-02-12 Flavio

CSVファイルにそうようにフォーマットされます。http://textblob.readthedocs.io/en/dev/classifiers.html – vendaTrout

はい@vendaTrout これは、ファイルの例を次に示します。 '' 'instagrama、Instagramの＃fbと、FACEBOOK facebookio、FACEBOOK facebooktimeメッセンジャーiphone、FACEBOOK のWhatsApp COM、WHATSSUP facebooko＃FB、FACEBOOK facebookiokioの＃fbと、FACEBOOK instagramas：、InstagramののFacebookのhttps：FB、FACEBOOK Facebookの＃FB、FACEBOOK '' ' – Flavio

列車のデータとラベルが分離されていると仮定すると"\ n"によって、あなたはより小さいcsv、またはこれのために関数をプロファイリングできますか？ stdlib [profiling]（https://docs.python.org/3/library/profile.html）モジュールをご覧ください。 – vendaTrout

このライブラリに問題があります。

これは、以下のリンクに記載されます：

https://github.com/sloria/TextBlob/pull/136

https://github.com/sloria/TextBlob/issues/77

小さな物語：ライブラリは、大規模なデータセットとよくない取引を行います。

出典

2017-02-15 11:50:13 Flavio

Naive Bayesクラシファイアでopen（）文を使用すると長時間かかる

答えて

関連する問題