2017-05-09 6 views
-3

私は現在仕事中の私の仕事の一つを見ています。それを解決するためにいくつかの考え方や新しいアプローチを検討しています。フィールドの専門家からの助け:-)。複雑なデータの分析に機械学習アルゴリズムを適用したい

現在、オフショアプラットフォームの構築コストと現在のフィールドの発見リソースの関係(年間生産量の平均を使用することができます)の履歴データの複雑なデータセットの分析を行っています。各データポイントには、地理的起源、主要炭化水素のタイプ、水深、最寄りのインフラまでの距離、プラットフォームのタイプなどのパラメータセット(合計10個のパラメータ)があります。 アイデアは、将来のフィールドの生産/リソースが常に報告されるので、将来のフィールドのコストを予測するために使用できるトレンドラインを構築することです。

リソース/生産量が増加するとコストが増加する傾向があります。したがって、このモデルでは線形性は容易に観測できますが、この場合、単純な線形回帰はあまりにもダミーです。データセットにはさまざまな情報があります。

私は数学的方法とPDEに特化した応用数学で修士号を取得しましたが、現在私が直面しているのはかなり統計学的な業界関連の問題です。私はまた、このタスクは、ますます多くのデータポイントが継続的に追加され、将来のフィールドのコストを予測するために曲線/トレンドラインを使用できることを考慮して、機械学習のアルゴリズムを適用することによって解決される完全な候補であると考えています。生産/資源と自然(パラメータ)。しかし、私はこの分野に全く新しいですので、あなたからなど任意のコメント、情報は非常

事前

+1

見ることができる人です。最初に - http://stackoverflow.com/help/how-to-askを参照してください - 具体的な質問をして特定の回答を得なければなりません。私たちはあなたを助けようとしますが – gusto2

答えて

0

のおかげでこの質問は私見は本当に特定の非常に広いとではありませんので、あなた:-)いただければ幸いです特定の答えではないことが広範になることがあります。

私はあなたが機械学習を実装するための素晴らしいユースケースを持っていると信じています。よくできました。

非常に実用的で実用的な「ハウツー」リソースを得ることをお勧めします。私は実際にthis ML courseを楽しんでいました。どこから始めたら、データを学習、テスト、クロスバリデーションのセット、正規化、正則化、派生されたフィーチャなどに分割するなど、実践的なアプローチに沿って進めるべきかを指摘できます。

一般的に、あなたの問題は複数の機能を備えた教師付き機械のように見えます。線形回帰は(あなたが指摘したように)完全には機能しないかもしれませんが、より複雑なモデルを構築しようとすると、複雑すぎることはありません。私は、正規化されたパラメータを持つ多項式モデルから始め、いくつかの派生したフィーチャがあまり適合しないかどうかを確認します。

しかし、それだけであなたのStackOverflowへようこそどのようにあなたのデータがどのように見えるとモデルをどのように開始することができ:)幸運

+0

お返事ありがとうございました!私はその質問が幅広いものであることに完全に同意し、私はそれについて正確な答えを得ることを期待していませんでした。ちょうど誰かが私に正しい方法を指示してほしいと思った。スタックオーバーフローは、私がそのようなアドバイスを得るのに最適な場所だと私は思っています。私は間違いなくコース時代のコースに自分自身を登録します!もう一度、あなたのコメントのために多くのおかげで –

関連する問題