2017-07-10 18 views
0

私は、交通工学に関するいくつかの変数(車線数、車線品質、人口など)を含むCSVファイルを持っています。Wekaで** K-Star **アルゴリズムを使用して生成された方程式を見つけるにはどうすればよいですか?

最後の列は道路に設置されたセンサーに基づいて計算されるADT(平均1日の交通量)です。

同じ変数で他の道路のADTを予測し、最終的に私のCSVファイルで予測されたADTと実際のADTを比較したいと思います。

データセットを2つの部分(70%と30%)に分けました。私はオプションuse training setを選択する私のデータセットの70%を取得し、supplied test setを選択する他の30%をテストK-スターアルゴリズムを使用してウェカで

、。

私はADTを予測するためにほぼ3%の誤差で良好な結果を得ました。しかし、問題は、ADTの計算方法を示すための式を提供しないため、他のデータセットの式を適用できないということです。

線形回帰アルゴリズム(K-Starの代わりに)を使用した場合、結果は良くありません(エラーの65%)が、ADTを計算する式を提供します。

K-Starアルゴリズムを使用して生成された方程式を見つけるにはどうすればよいですか?

+0

SO Mohammadへようこそ! 「良い」質問をする方法についてのガイドをお読みください。これは、迅速かつ関連性の高い回答と、他のユーザーが質問/回答ピアを簡単に見つけられるようにするのに役立ちます。 https://stackoverflow.com/help/how-to-ask –

答えて

0

K-starアルゴリズムは、分類しようとしているインスタンスに「類似のメンバ」を見つけ、そのラベルを分類(K-nearest-neighborsの並べ替え)を提供するために使用します。アルゴリズムが使用する唯一の方程式は、2つのインスタンス間の類似関数(例えば、ユークリッド距離)である。

クラシファイアを使用する場合は、モデルをファイルに出力し、Weka(コード、GUI、コマンドラインなど)を使用して他のデータセットを分類することができます。

幸運を祈る!

+0

ありがとうございます。しかし、私はまだ式を抽出することはできません。他のアイデア? –

+0

私の答えをもう一度読んでください。アルゴリズムは方程式を出力しません。 – AndreyF

関連する問題