0
私は、3483行と460K文字と65K語のcsvファイルを持っていますが、このコーパスを使ってScikitでNaiveBayesクラシファイアを学習しようとしています。Naive Bayesクラシファイアでopen()文を使用すると長時間かかる
問題は、この文を以下に使用すると、時間がかかりすぎる(1時間で終了しなかった)ことです。
from textblob import TextBlob
from textblob.classifiers import NaiveBayesClassifier
import csv
with open('train.csv', 'r') as fp:
cl = NaiveBayesClassifier(fp, format="csv")
私は何を間違えていると思いますか?
ありがとうございます。
CSVファイルにそうようにフォーマットされます。http://textblob.readthedocs.io/en/dev/classifiers.html – vendaTrout
はい@vendaTrout これは、ファイルの例を次に示します。 '' 'instagrama、Instagramの #fbと、FACEBOOK facebookio、FACEBOOK facebooktimeメッセンジャーiphone、FACEBOOK のWhatsApp COM、WHATSSUP facebooko#FB、FACEBOOK facebookiokioの#fbと、FACEBOOK instagramas:、Instagramの のFacebookのhttps:FB、FACEBOOK Facebookの#FB、FACEBOOK '' ' – Flavio
列車のデータとラベルが分離されていると仮定すると"\ n"によって、あなたはより小さいcsv、またはこれのために関数をプロファイリングできますか? stdlib [profiling](https://docs.python.org/3/library/profile.html)モジュールをご覧ください。 – vendaTrout