1

私はある種のオブジェクトモデルを持っています。それをフィルタリングして、ある種のプロパティのノードをソートする必要があります。どのような自動化されたシステムが、私が望むものに関連するオブジェクトモデルのプロパティを生成し、選択するのに存在しますか? (私は意図的に抽象的で非特異的である)オブジェクトモデルノードをフィルタリング/ソート/ランク付けする方法は?

私は、趣味のノードを見つけるルールを識別するデータセットの例では、迷惑メールフィルタや教師付き分類システムのような働きをするシステムを考えている。しかし、私はオブジェクトモデルに関する設計時間情報を必要としないという点で、より一般的なシステムを探しています。それは電子メールの迷惑メールフィルタ、コードベースのバグファインダ、ニュースグループのインタレストフィルタ、ソーシャルネットワーキングサイトのボットアカウントファインダとしても機能します。リフレクションを介してオブジェクトモデルを探索し、一連の「面白い」ノードが与えられれば、ノードのような多くのノードを見つけるルールを見つけることができます。

+1

ところで、良い解決策がないと私は全く驚くことはありません。 – BCS

答えて

1

あなたが求めていることすべてを行うことができる単一の自動分類システムがあることはほとんどありません。さらに、バグ・ファインダー・アプリケーションは、そのドメインでうまく使用されているメソッドが構文解析、データ・フロー分析、およびソフトウェア・エラーを取り巻く問題に合わせて高度に調整されたアルゴリズム方式を中心に使用されているため、そこでは機械学習の研究が行われていますが、この分野の分類システムは、(私が知る限りでは)分析方法に取って代わるのではなく、ほとんどを補強するために使用されています。

ほとんどの重要でない分類問題では、機械学習によって有用で効果的な結果を得るためには、通常、問題表現の慎重な選択と洗練が必要です。状態空間のある種の調整された変形を伴わずに既存の「生の」データオブジェクトモデルを単に用いることは、入力データ値の分布の不完全なカバレッジ及び/又は学習された分類子の一般化の不十分を導く傾向がある。さらに、使用されている機械学習方法に固有の他のパラメータは、所与の問題について適切な結果を得るために試行錯誤を必要とすることがある。ニューラルネットワーク、遺伝的アルゴリズム、ベイジアン推論法など、すべてのメソッドにこのようなパラメータがあるわけではありません。現在、存在するものではないほぼ普遍的な機械学習メソッドです。私が見ることができる最も実行可能な選択肢は、(1)必要な能力/洗練のレベルではない、異なる問題のサブセットを見つけること、または(2)1つの分類手法だけでなくむしろ与えられた問題に対して自動的にテストし、それから監督の学習体制の下で最良の分類結果を生成するものを使用する、異なる方法のツールボックスを持っています。後者は依然として効率的に取り組むことが非常に困難であり、データモデルの状態空間をどのように表現/変換するかの問題を解決するものではありません。

+0

最後の文「データモデルの状態空間を表現/変換する方法」の後半。実際に私が解決策について疑問に思っている問題を正確に記述しています。 – BCS

+0

状態空間モデル問題の1つの可能性は、「ツールボックス」の概念を拡張し、様々な表現を自動的にテストすることです。これには、(1)変換([離散値またはテキストデータの一部のタイプでは正常に機能する])、(2)自然言語の概念クラスタまたはオントロジ、(3)数値データの粗いコーディング表現などがあります。パターンをより簡単に学習するために状態空間を有用な方法で分割する適切な機会を提供する一般的なスキームでもありますが、よりカスタマイズされたアプローチの機能はありません。 –