-1
機械学習の分野では初めてです。 10人の電話通話履歴を分類しようとしています。序文のデータで分類する方法
電話の通話ログはsklearnからSVMと8700のログのこの種の訓練を受け、この
UserId IsInboundCall Duration PhoneNumber(hashed)
1 false 23 1011112222
2 true 45 1033334444
のように見えるが、結果を与える精度は88%
は、私はいくつかを持っていますこの結果に関する質問と
何らかの序数データ(電話番号など)を使用する適切な方法
- ハッシュされた電話番号を機能として使用しているかどうかはわかりませんが、このマルチクラス分類器の精度は悪くありません。ちょうど偶然ですか?
- not oridnalデータをフィーチャーとして使用するにはどうすればよいですか?
- この分類器はより1000のクラス(以上1000人のユーザ)を分類する必要がある場合、SVMは、まだそのような場合に動作しているのですか?
私には助言があります。おかげ