だから、私は次の表を持っていると仮定します。意味:次のようなもの:SparkのSQL:DISTINCTのすべての値を取得するにはどうすればよいですか? - どのように多くとそれらの値私は名前ごとに異なる色のテーブルを取得したいと思い</p> <pre><code>Name | Color ------------------------------ John | Blue Greg | Red John | Yellow Greg | Red Greg | Blue </code></pre> <p>:
Name | Distinct | Values
--------------------------------------
John | 2 | Blue, Yellow
Greg | 2 | Red, Blue
どのようにすればいいですか?
'非常にsimple'は、指定しないようにミスを犯し、あなたのRDBMS、以下にsimple''から変えています:ここで私はこれを行うために作成したクラスです。だから回答を編集し、RDBMSを追加してください –
@ThomasG公平なプラットフォームが指定されており、RDBMSではありません。 – zero323
[PySpark 1.5.0では、列\ 'x \'の値に基づいて列\ y \のすべての項目をどのようにリストしますか?](http://stackoverflow.com/questions/36115411/)あなたのリストのすべての項目の列のyの値に基づく – zero323