0

私は、3483行と460K文字と65K語のcsvファイルを持っていますが、このコーパスを使ってScikitでNaiveBayesクラシファイアを学習しようとしています。Naive Bayesクラシファイアでopen()文を使用すると長時間かかる

問題は、この文を以下に使用すると、時間がかかりすぎる(1時間で終了しなかった)ことです。

from textblob import TextBlob 
from textblob.classifiers import NaiveBayesClassifier 
import csv 

with open('train.csv', 'r') as fp: 
    cl = NaiveBayesClassifier(fp, format="csv") 

私は何を間違えていると思いますか?

ありがとうございます。

+0

CSVファイルにそうようにフォーマットされます。http://textblob.readthedocs.io/en/dev/classifiers.html – vendaTrout

+0

はい@vendaTrout これは、ファイルの例を次に示します。 '' 'instagrama、Instagramの #fbと、FACEBOOK facebookio、FACEBOOK facebooktimeメッセンジャーiphone、FACEBOOK のWhatsApp COM、WHATSSUP facebooko#FB、FACEBOOK facebookiokioの#fbと、FACEBOOK instagramas:、Instagramの のFacebookのhttps:FB、FACEBOOK Facebookの#FB、FACEBOOK '' ' – Flavio

+0

列車のデータとラベルが分離されていると仮定すると"\ n"によって、あなたはより小さいcsv、またはこれのために関数をプロファイリングできますか? stdlib [profiling](https://docs.python.org/3/library/profile.html)モジュールをご覧ください。 – vendaTrout

答えて

関連する問題