spark scalaでk-meansアルゴリズムを書くには

-1

私はapache sparkとscalaを初めて使っています。私はkを書くことによって練習しようとしていました。このデータはインターネット上で実践されています。しかし、私はこれで何をするかを理解できません。私はk-meansがクラスタリングアルゴリズムであることを知っていますが、このデータセットにこれをどのように適用するのか分かりません。このデータへください連中kは、意味私は、この問題文を理解し、適用するアルゴリズムを設定spark scalaでk-meansアルゴリズムを書くには

問題文の

abcMobileは新しいオープンネットワークキャンペーンを導入している携帯電話サービスプロバイダです。このキャンペーンの一環として、ネットワークで問題が発生した場合、その地域のタワーについて、招待されたユーザーからの苦情申し立てのリクエストがあります。 abcは苦情を提起したユーザーのデータセットを収集しました。データセットの4番目と5番目のフィールドは、会社の重要な情報である緯度とユーザーの経度を持っています。利用可能なデータセットのベースでこの緯度と経度の情報を見つけ、 k-meansアルゴリズムを使用して3つのユーザークラスターを作成する必要があります。これにより、ユーザのカバレッジを最大限に引き出すのに役立ちます。

データセット：dataset

出典

2017-08-21 Rohit Chopra

私はこれより良いが、CVに属していると思いますが、私はそれに取り組むしようとするでしょう。まず第一に、彼らは地理的に集中しようとしている。彼らは、ユーザーの最大のクラスタがどこにあるのかを知りたいので、セルタワーをその中心に置くことができます。

あなたが開始する方法は、各ユーザーの緯度と経度を引き出し、それをsparkのMLLibまたは独自のK平均アルゴリズムに差し込むことです。（実装上の問題がある場合は、別の質問に行く必要があります）。

出典

2017-08-21 15:37:05 bendl

okkです。 –

spark scalaでk-meansアルゴリズムを書くには

答えて

関連する問題