2017-01-31 16 views
0

私の卒業論文のために、私は天文画像データで動作するようにpythonパイプラインに加えてサードパーティのプログラム(SExtractor)を使用しています。 SExtractorは、入力として数多くのパラメータを持つ設定ファイルを取ります。これは、(いくつかの中間ステップの後で)私のデータの統計に影響を与えます。私はすでにパラメータを使って遊んで過ごす時間を過ごしてしまったので、機械学習を少し見てきて、非常に基本的な理解を得ました。機械パラメータを最適化するための学習

私が今思っているのは、パラメータの性能や品質を判断する唯一の方法が解析実行の最終統計である場合に、機械学習アルゴリズムを使用してSExtractorのパラメータを最適化することは合理ですか? (私のマシンでは少なくとも1時間かかる)、統計に影響する6つ以上のパラメータがあります。

例として、Sextractorパラメータのわずかに異なるバージョンから作成した2つの異なるバージョンの統計を取り上げました。左の画像の赤い線は標準偏差の中央値です(それはそうでなければなりません)。青い線は標準偏差の中央値です。右側の画像には、2つのデータセットのオブジェクトの違いが表示されます。

私はこれは非常に具体的な質問ですが、私は機械学習には新しいので、これが可能かどうか本当に判断できません。これは無意味な試みであり、私が正しいと指摘してくれれば誰かが私に示唆することができれば素晴らしいだろう。 Example 2Example 1

+1

私はこの質問を[Cross Validated](http://stats.stackexchange.com/)に投稿することを検討するべきだと思います。 – Thomas

+0

@トーマス、チップをありがとう。私はこのようなフォーラムがあることさえ知りませんでした。 –

+0

取得したい統計情報の「真実の真実」はありますか? – ginge

答えて

0

あなたがすでに持っているデータに基づいて推測された推測を試すことができます。標準偏差の中央値が望ましい値になるようにパラメータを最適化しようとしています。さまざまなモデルを仮定し、モデルと推定データに基づいてパラメータを推定しようとすることができます。しかし、私はそうするために機械学習をよく理解しておくべきだと思います。良いとは、私は、学部課程であることを意味します。