私は監督されたデータを含むpysparkデータフレームを持っています。私のデータフレームでは、label属性はどの位置にあってもかまいません。私はラベルの属性を最後のデータフレームに移動したいと思います。例えば、私のデータフレーム内の属性が[年齢、性別、脱落者、給料、職業]のように存在するとします。この「逃亡者」にはラベル属性があります。この属性を最後に移動して、データフレームに[age、 'gender'、 'salary'、 'occupation'、 'defaulter']の列を含むようにします。私は、このデータにロジスティック回帰などのML藻類を適用したいとき、RDDに変換して、最後の値(または最初の値)をラベルポイント(https://github.com/apache/spark/blob/master/examples/src/main/python/mllib/logistic_regression.py)として抽出する必要があるため、これを実行したいと思います。pysparkデータフレームの列の順序を変更する方法は?
-2
A
答えて
0
データフレームでMLアルゴリズムを実行する場合は、フィーチャ配列を作成するのにVectorAssemblerを使用することを検討してください。このように:
assembler = VectorAssembler(
inputCols= ['age','gender','salary','occupation'],
outputCol="features")
input_rdd = assembler.transform(dataframe) \
.map(lambda row: LabeledPoint(row.defaulter, row.features))
の
関連する問題
- 1. Foundationで3つの列の順序を変更する方法
- 2. ブートストラップ - 列の表示順序を変更する方法
- 3. 列の順序を変更する
- 4. Pyspark:データフレーム列のjson文字列を変換する方法
- 5. パンダのデータフレームの順序や行と列のラベルを変更する
- 6. DataGripまたはIntelliJの列の順序を変更する方法は?
- 7. 結合後のPysparkデータフレームで複数の列を選択して順序付ける方法
- 8. データフレームのレベルの順序を保存する方法は?
- 9. pysparkデータフレーム列のデータ型を変更するには?
- 10. CSSの列の順序を変更
- 11. pysparkのデータフレーム列を更新する
- 12. Rの文字列の順序を変換する方法は?
- 13. GenBankレコードの順序を変更する方法は?
- 14. Jaspersoft Studioでサーバーの順序を変更する方法は?
- 15. 引数の順序を変更する方法は?
- 16. VCでContextMenuの順序を変更する方法は?
- 17. linuxでテキストの順序を変更する方法は?
- 18. OrderedDictの順序を変更する方法は?
- 19. QCompleterポップアップの順序を変更する方法は?
- 20. SAS:カテゴリ変数の順序を変更する方法
- 21. jQGrid - 列の順序を変更
- 22. プッシュ/プルブートストラップで列の順序を変更
- 23. WPFバインド順序 - 変更方法
- 24. 変更DataGridの列の順序やインデックス
- 25. nopcommerceのドロップダウンリストの項目の順序を変更する方法
- 26. Xamarin iOSのUITableViewで行の順序を変更する方法
- 27. Jenkinsのビューの順序を変更する方法
- 28. Eclipse/SpringSource Tool Suiteのソースフォルダの順序を変更する方法
- 29. 南の移行の順序を変更する方法
- 30. コース単位のページの順序を変更する方法
可能な重複[Pythonのパンダ - 並べ替え列名に基づいてデータフレームの列を](https://stackoverflow.com/questions/11067027/python-pandas-re-ordering-columnsカラム名に基づくデータフレーム) – charlesreid1