私はSparkにとって少し新しく、単純なマッピングをしようとしています。
私のデータは、以下のようなものです:pysparkのリストの各行のタプルの最初の項目を取得する
RDD((0, list(tuples)), ..., (19, list(tuples))
私は何をしたいことは、各タプルの最初の項目をつかんされているので、最終的にはこのような何か:
RDD((0, list(first item of each tuple),..., (19, list(first item of each tuple))
は、誰かがどのように私を助けることができますこれを地図にするには?
私はそれを感謝します!
ああ、これは完全に意味があります。ありがとう@AChampion –