SciPyを使用してマシン上のテキストを分類できますが、HTTP POST要求から文字列オブジェクトをリアルタイムで、またはほぼリアルタイムで分類する必要があります。私の目標が並行性が高く、リアルタイム出力が近く、メモリのフットプリントが小さい場合は、どのアルゴリズムを調べるべきですか?私は、Goでサポートベクターマシン(SVM)の実装を手に入れることができたと考えましたが、それは私のユースケースにとって最高のアルゴリズムですか?HTTPポストオブジェクトを最も安価に分類する方法
0
A
答えて
1
はい、SVM(線形カーネル付き)は良い出発点であるはずです。あなたはscikit-learn(これはliblinearと思っています)を使ってモデルを訓練することができます。モデルが学習された後、モデルは単に分類する各カテゴリのfeature:weight
のリストに過ぎません。このような何か(あなたが唯一の3つのクラスがあるとします):
class1[feature1] = weight11
class1[feature2] = weight12
...
class1[featurek] = weight1k ------- for class 1
... different <feature, weight> ------ for class 2
... different <feature, weight> ------ for class 3 , etc
は、あなたがscikit-学ぶ全く必要ありません、あなたは線形を行うには、サーバーのバックエンドで使用しているどんな言語で使用することができます計算。特定のPOSTリクエストは、機能が含まれていると(特長3は、feature5)、何をする必要があると、このようなものです:
linear_score[class1] = 0
linear_score[class1] += lookup weight of feature3 in class1
linear_score[class1] += lookup weight of feature5 in class1
linear_score[class2] = 0
linear_score[class2] += lookup weight of feature3 in class2
linear_score[class2] += lookup weight of feature5 in class2
..... same thing for class3
pick class1, or class2 or class3 whichever has the highest linear_score
さらに一歩:あなたは(特徴重みを定義するためのいくつかの方法を持っている可能性がある場合など、使用してTF-IDFトークンのスコア)、その後、あなたの予測はなるかもしれない:
linear_score[class1] += class1[feature3] x feature_weight[feature3]
so on and so forth.
注feature_weight[feature k]
は、要求ごとに、通常は異なっています。 要求ごとに、アクティブな機能の総数は考慮する機能の総数よりもはるかに小さくなければなりません(50個のトークンまたは機能を1個のMMトークンのボキャブラリとみなす)ので、予測は非常に速くなければなりません。モデルの準備が整ったら、キー値ストア(例:redis)に基づいて予測の実装を書いただけです。
関連する問題
- 1. IEnumerableをコピーする最も安価な方法<T>?
- 2. 単一のオブジェクトを作る最も安価な方法Enumerable?
- 3. 自分のテキスト分類子を評価する方法
- 4. 10mのエンティティからアプリケーションエンジンにインポートする最も安価な方法
- 5. ASP.Net MVCアプリケーションを展開する最も安価な方法は何ですか?
- 6. 最も安い価格を返すには?
- 7. FiddlerでHTTPレスポンスのヘッダーの分類を変更する方法
- 8. Ionic Phonegap Cordova:iOS向けに最も安価なMacモデルですか?
- 9. カスタムの分類にカスタム分類を追加する方法は?
- 10. 最も安い方法レールで
- 11. SQL Server - 最も安いサプライヤ価格を得る
- 12. AzureでMongoDBをホストするのに最も安い方法
- 13. データベースに接続する最も安全な方法
- 14. Pythonで姓を分類する最速の方法
- 15. インターネット経由でビデオをストリーミングする最も安全な方法
- 16. 最も安全な方法は、PHPでセッションを作成する
- 17. テーブルの行IDを参照する最も安全な方法
- 18. MySQLパブリックサーバiMacを設定する最も安全な方法
- 19. Firebaseから値を取得する最も安全な方法
- 20. Webサーバー(HTTP/FTP)からファイルをプログラマチックにダウンロードする最も安全な方法は何ですか?
- 21. 現在の行よりも安い製品価格を計算する方法
- 22. 外部postgresqlホスティング用の最も安価なソリューション
- 23. 最も価値の高いIDを見つける方法
- 24. テンソルフローフレームワークで最も価値の高いトレーニングデータを得る方法
- 25. TomcatをApache HTTPインスタンスに戻す最も簡単な方法
- 26. どのラベルにも一致しないデータを分類する方法
- 27. httpでセキュリティを実装する最も良い方法は
- 28. Perl HTTP :: Request - クエリパラメータを解析する最も良い方法
- 29. 機密情報をプロトコルバッファにロードする最も安全な方法
- 30. 私のホームオートメーションWebサーバーを最も安全に保護する方法は?