DellのStatisticaソフトウェアを使用して一部のデータを分析しました。私はこの分析を科学論文に使用しています。データマイニングは私の最初の話題ではありませんが、以前はData Miningクラスを取り入れて知識を持っていました。Statisticaの%75と%25データサンプリングと10倍の相互検証はどのように連携しますか?
%75%25(数値が変わる可能性があります)のトレーニングとテストパート、またはn倍のクロスバリデーションでモデルのパフォーマンスをテストします。
モデルの実行前のStatistica SVMモデリングには、構成を行うためのタブがあります。データサンプリングタブでは、%75、%25の区切りを入力し、十字妥当性検査タブでは10倍の相互検証を入力しました。出力では、データがトレーニングとテストとして実際に分離されていることがわかります(モデル値はテスト値に対して与えられています)。
クロス検証エラーもあります。私は以下の結果をコピーします。私はこの出力の理解と解釈には困難があります。私と比較してより良い統計を知っている人、および/またはこのツールにもっと経験豊富な人が、それが私にとってどのように機能するかを説明してくれることを願っていますか?
Ferda
サポートベクターマシン結果SVM型: 回帰タイプ1(容量= 9.000、ε= 0.100)カーネルタイプ:サポートベクトルの 放射基底関数(ガンマ= 0.053)数= 705 (674有界)相互検証誤差= 0.244
平均誤差二乗= 1.830(列車)、0.193(試験)、1.267(全体)SD比= 0.952(電車)、37076026627971.336(テスト)、0.977(全体)の相関係数= 0.314(電車)、-0.000(テスト)、0.272(全体)