2017-02-07 8 views
1

私ののSQLサーバーデータベースでは、私はデータ値のセット 'A'を持っている。 x軸、y軸、z軸には、6000個の奇数行と3列の点があります。3d点のセットの関連サブセットを見つける

私は、セットAのデータに似ている100点だけのサブセット「B」を推測しなければなりません(たとえば、3d空間のどこか2点が無視されなければならないどこかの点の集まりがある場合は、該当する点または2点で表す必要があります)。

あなたはこのための手順や機能を作成するのを手伝ってください。 私はネットと自分自身を試しましたが、私が実装できる正しい解決策は見つかりませんでした。

+0

あなたがここに欲しいものを完全に明らかではありません。それはあなたが何らかの種類のクラスタリング分析をしたいと思うように思えますが、それは正しいのですか? –

+0

正確です。私は既に持っているものに点のクラスタを最も必要としています –

+1

SQL Serverではなく、クラスタリングパッケージを使用してRでこれを処理します。 SQLは、複雑なデータマイニングではなく、データの大量読み込み用です。 –

答えて

1

ポリラインの簡略化のアルゴリズムが必要です。おそらく、最も人気の一つはDouglas-Peucker algorithm

アルゴリズムの目的である、より少ない点で同様の曲線を見つけるために、ライン セグメントからなる曲線与えられます。

それはまだ明らかではない - 外れ値をどうするか - (D_Pアルゴは、それらを保存しようとするため)、おそらくあなたは、いくつかの平滑化または別のフィルタリングを必要とする

+0

私はこれも検索しましたが、実際にはすべての外れ値を保持していると彼らは非常に重要なので集中雲を削除します –

+0

あなたは明確な基準を定義しなければなりません - どの点が異常値であり、何が重要であるか。垂直距離のD-P基準がフィルタリングに使用されることに注意してください。 – MBo

+0

私は2段階治療を試みる価値があることを示唆しています-1。 D-Pの簡略化 – MBo

関連する問題