を特定のフィールドを取得、私はこれがあるchosen_userデータを、アクセスしたいです_idフィールド。私はすることができます私は今</p> <pre><code>sc = SparkContext() sqlc = SQLContext(sc) users_df = sqlc.read.json('users.json') </code></pre> <p>としてJSONファイルから<em>pyspark</em>を通じて構築スパークデータフレームを持ってPyspark DATAFRAMEで選択された行から
print users_df[users_df._id == chosen_user].show()
これは私にユーザーの完全な行を与えます。しかし、行の中に特定のフィールドを1つだけ望み、ユーザーの性別をどのように取得すればよいとしますか?
複数の 'selected_user'の値に基づいて行を抽出することはできますか? – Nivi