0
は、例えばデータフレームである:列ヘッダーはDataframeの行にありますか?ここ
cols = ["report_suite", "ProductID", "Manufacturer", "Brand Manager", "Finish"]
data = [["rs_1", "ProductID", "Manufacturer", "Finish", np.nan], ["rs_2",
"ProductID", "Manufacturer", "Brand Manager", "Finish"], ["rs_3",
"Brand Manager", "Finish", np.nan, np.nan]]
df = pd.DataFrame(data, columns = cols)
私は何をしたい列ヘッダーは(report_suite
列を含まない)データの行であるか否かについての各列のブールとピボットテーブルを持っています。私はあなたがデータフレームのインデックスを変更する方法を見つけ出すことができれば、あなたは良いですが、辞書のアプローチを使用し
cols = ["report_suite", "ProductID", "Manufacturer", "Brand Manager", "Finish"]
data = [["rs_1", 1, 1, 0, 1], ["rs_2", 1, 1, 1, 1], ["rs_3", 0, 0, 1, 1]]
final_df = pd.DataFrame(data, columns = cols)
実際には、これは必要なものではありません。これは、行データが列ヘッダーと同じ順序である場合にのみ機能するためです。私は、列見出しがデータの行のどこにでもあるかどうかを確認する必要があります。 – Hound
@Hound、テキストを「ワンホットエンコード」したいですか?あなたはあなたの "生データ"の例を作ることができますか? – MaxU
列のデータがヘッダーと必ずしも一致しないので、正確には「1つのホットエンコーディング」ではありません。たとえば、2番目の行ではすべての列がヘッダーと一致しますが、3番目の行で最初の値「ブランドマネージャー」が3番目の列ヘッダーに一致します。 – Hound