こんにちは私はナイーブベイズモデルを使って病気の分類に取り組んでいます。 症状とともに症状を持つCSVファイルがあります。 CSV形式: 症状-1症状-2症状-3病気 naiveベイズモデルにこのCSVを提供し、症状に基づいて病気を分類する方法 CSVを読み、NaïveBayesモデルに提供する標準コードはありますかクラスを実行する 私はスパークマシン学習ライブラリを使用してこれを行う。ナイーブベイズ分類器にCSV入力を提供する方法
答えて
これは
import org.apache.spark.mllib.classification.{NaiveBayes, NaiveBayesModel}
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.regression.LabeledPoint
val data = sc.textFile("your csv path")
val parsedData = data.map { line =>
val parts = line.split(',')
// The labeled point is LabeledPoint(Disease,(Symptom 1,2,3)) // Assuming that all of them are numeric
LabeledPoint(parts(3).toDouble,Vectors.dense(parts(0).toDouble,parts(1).toDouble,parts(2).toDouble))
}
// Split data into training (60%) and test (40%).
val splits = parsedData.randomSplit(Array(0.6, 0.4), seed = 11L)
val training = splits(0)
val test = splits(1)
val model = NaiveBayes.train(training, lambda = 1.0, modelType = "multinomial")
val predictionAndLabel = test.map(p => (model.predict(p.features), p.label))
val accuracy = 1.0 * predictionAndLabel.filter(x => x._1 == x._2).count()/test.count()
// Save and load model
model.save(sc, "target/tmp/naiveBayesModel")
val sameModel = NaiveBayesModel.load(sc, "target/tmp/naiveBayesModel")
を参照してください。少し努力してください!どんな誤り、どこで...我々はテレパシーではない。 –
@SandeepDvsのエラーコードを実行しようとしているときに、http://stackoverflow.com/help/mcve –
Error:(25,45)value denseは、オブジェクトscala.collection.immutable.Vectorのメンバーではありません。 LabeledPoint(parts(3).toDouble、Vector.dense(parts(0).toDouble、parts(1).toDouble 、parts(2).toDouble)) ^ –
- 1. ナイーブベイズ分類器
- 2. ナイーブベイズ分類器の精度
- 3. スタンフォード-nlpナイーブベイズ分類器トレーニング
- 4. NLTKによるセンチメント分類ナイーブベイズ分類器
- 5. バイナリデータを持つナイーブベイズ分類器
- 6. ナイーブベイズ分類器抽出要約
- 7. ナイーブベイズ分類器を実装する際の精度が低い
- 8. ナイーブベイズ分類器のベルヌーイモデルのラプラス平滑化
- 9. テキスト分類。 TFIDFとナイーブベイズ?
- 10. application.propertiesファイルを入力としてスプリングブートドッカーイメージに提供する方法
- 11. テンソルフローの分類モデルを提供
- 12. スタンフォード分類器対ウェカ分類器
- 13. 分度器 - 分度器のデフォルトの入力言語を設定する方法
- 14. 悪い入力形状():Openface問題分類器に
- 15. Accord.NET DecisionTreesの入力データを正しく提供する方法
- 16. rnnモデルへのテスト入力を提供する方法
- 17. 分度器:Cmd行のURLを入力する方法
- 18. 分類器のパラメータにエラーのグラフをプロットする方法
- 19. 複数のSVM分類器(または「任意のML分類器」をscikit-learnを使用して組み合わせる方法「決定特徴分類器」
- 20. nltk naivebayesテキスト分類用の分類器
- 21. Visual Studioでデバッグモード中にJavaコードにユーザー入力を提供する方法コード
- 22. スケーラブルニューラルネットワークsoftmax分類器
- 23. input()に入力を提供する唯一の方法はサブプロセスですか?
- 24. java.lang.Processクラスを使用して別のプロセスに入力を提供する方法
- 25. 再生フレームワークでCSVデータを正しく提供する方法
- 26. Rの分類器モデルでアンサンブルを実行する方法
- 27. 分類器を正しく組み合わせる方法は?
- 28. commheと行を使用してwhiptailの入力を提供する方法
- 29. レビューで分類器をテストする
- 30. エラー:9 TfidfCountvectorizerとのフィッティング多項ナイーブベイズ分類器が、私は殺されていますフィッティングsklearn.naive_bayes.MultinomialNB()
から変形例であり、あなたは何を試してみましたか? csvの読み方の例はたくさんあります。あなたはどこにいらっしゃいますか? –
https://drive.google.com/open?id=0ByqOTgDAvFWCdHVxcmxJRzZicm8 –
いいえ、コードを説明してください。私は誰もがzipファイルをダウンロードし、それを介して動作することを疑う。 –