によってpysparkのデータフレームにアクセスする方法(df.limitによると同様に(1)。私は新しいデータフレームにデータフレームの最初の行を得ることができます)。pyspark、スパーク:最後の行を選択する方法も最後の行を取得する方法</p> <pre><code>name age city abc 20 A def 30 B </code></pre> <p>ようpysparkのSQLのデータフレームからインデックス
index.like行番号でデータフレーム行にアクセスするにはどうすればよいですか。 12または200である。パンダで
私は
df.tail(1) # for last row
df.ix[rowno or index] # by index
df.loc[] or by df.iloc[]
私は、このような方法または代替の方法でpysparkのデータフレームにアクセスする方法を単に好奇心行うことができます。最後の行を取得する方法
おかげ
こんにちはを使用して作成することができます行をautoincrement IDカラムで追加するか、または小さいdfのために、私はtoPandas()。tail(1)を使用していました。とにかくお返事いただきありがとうございます。私が尋ねたデータフレームの索引アクセスは、時には列の値を(col値の等価条件によって)置き換えなければならない場合があり、そのために私はudfの助けを借りて行っていました。しかし、1つのインスタンス(特定のインデックス番号行)だけを置き換えたい場合は、それを行う方法がありませんでした。今私は "zipWithIndex"を使うことができます。ありがとう。 – Satya