私はSpark 1.6でデータフレームを持っており、そこからいくつかの列を選択したいと考えています。私は特定の列を選択するには、このように行うことができます知っている共通のラベルで始まるすべての列を選択する方法
colA, colB, colC, colD, colE, colF-0, colF-1, colF-2
:列名が似ている
df.select("colA", "colB", "colE")
が、どのように、選択して「で、colA」、「COLB」と言うと、すべてのcolF-します*列はすぐに? Pandasのような方法がありますか? df.columns
と列名が、その後、あなたが.filter(_.startsWith("colF"))
をしたいだけの列名に絞り込む
質問に記載されているように他の列も選択していただきありがとうございます。 – user299791
私の問題の正確な解決策は、2番目と3番目のソリューションが混在しています...ありがとうございます。トピックを完全にマスターしてください – user299791