-1

私はapache sparkとscalaを初めて使っています。 私はkを書くことによって練習しようとしていました。 このデータはインターネット上で実践されています。 しかし、私はこれで何をするかを理解できません。 私はk-meansがクラスタリングアルゴリズムであることを知っていますが、このデータセットにこれをどのように適用するのか分かりません。このデータへ ください連中kは、意味私は、この問題文を理解し、適用するアルゴリズムを設定spark scalaでk-meansアルゴリズムを書くには

問題文の

abcMobileは 新しいオープンネットワークキャンペーンを導入している携帯電話サービスプロバイダです。このキャンペーンの一環として、 ネットワークで問題が発生した場合、その地域の タワーについて、 招待されたユーザーからの苦情申し立てのリクエストがあります。 abcは 苦情を提起したユーザーのデータセットを収集しました。データセットの4番目と5番目のフィールドは、会社の重要な情報である緯度と ユーザーの経度を持っています。 利用可能なデータセットの ベースでこの緯度と経度の情報を見つけ、 k-meansアルゴリズムを使用して3つのユーザークラスターを作成する必要があります。これにより、 ユーザのカバレッジを最大限に引き出すのに役立ちます。

データセット:dataset

答えて

1

私はこれより良いが、CVに属していると思いますが、私はそれに取り組むしようとするでしょう。まず第一に、彼らは地理的に集中しようとしている。彼らは、ユーザーの最大のクラスタがどこにあるのかを知りたいので、セルタワーをその中心に置くことができます。

あなたが開始する方法は、各ユーザーの緯度と経度を引き出し、それをsparkのMLLibまたは独自のK平均アルゴリズムに差し込むことです。 (実装上の問題がある場合は、別の質問に行く必要があります)。

+0

okkです。 –

関連する問題