-1
タイプはpyspark.rdd.PipelinedRDD
あり、そしてorigin
のようなものが含まれています。私は、キーとキーでソートされたすべてのアナグラムをしたいpysparkにアナグラムを探す
[u'masquerade',
u'squaremade',
u'dianas',
u'naiads',
u'antagonist',
u'stagnation',
u'bates',
u'beast',
u'beats',
u'thanks']
を:
[(u'aadeemqrsu', {u'masquerade', u'squaremade'}),
(u'aadins', {u'dianas', u'naiads'}),
(u'aaginnostt', {u'antagonist', u'stagnation'}), ...
(u'abest', {u'bates', u'beast', u'beats'}), ...]
私はそれを知っていますmap
またはreducebykey
の機能が必要な場合がありますが、どうすればいいか分かりません。