に類似した複数の列を作成するには、のは、私のデータは次のようになりましょう:パンダ - pd.get_dummies
df = pd.DataFrame({'color': ['red', 'blue', 'green', 'red', 'blue', 'blue'], 'line': ['sunday', 'sunday', 'monday', 'monday', 'monday', 'tuesday'],
'group': ['1', '1', '2', '1', '1', '1'], 'value': ['a', 'b', 'a', 'c', 'a', 'b']})
color group line value
0 red 1 sunday a
1 blue 1 sunday b
2 green 2 monday a
3 red 1 monday c
4 blue 1 monday a
5 blue 1 tuesday b
は基本的に、私が欲しいのは、各色の行のリストを取得することです。たとえば、赤色には、それぞれの行とそれに関連する値をそれぞれの列に表示する必要があります。そのトリックは、同じグループの色に関連する他の線も表示したいということです。それらの対応する値は「適格ではない」でしょう。したがって、私は私の出力は次のようになりたい:私はこれを行うために必要ないくつかの〜50,000ユニークな「色」は
color line_1 line_1_value line_2 line_2_value line_3 line_3_value
0 red sunday a monday c tuesday not eligible
1 blue sunday b monday a tuesday b
2 green monday c
があります。私はそれが比較的シンプルなものだと確信していますが、それを理解するための知識やスキルをまだ持っていません。どんな助けもありがとう!
を。これは、CLOです私が探しているものにはse。ただし、グループ内の別の色に関連付けられている行は考慮されません。したがって、 'red'のLine_2は火曜日に表示され、対応する値は '適格でない'と表示されます – tbg0001
最初のステップとしてデータフレームを修正するには、各グループのvalue列に 'not eligible'を追加し、グループを削除して上のアルゴリズムに進みます。重要なアイデアは、ピボットを適用する前に、必要なすべてを使ってデータフレームを準備することです。あなたはここで論理を見守っていますか? – Boud
データフレームの最後に追加のレコードを追加する方法を知ることができました。将来のために、すべての機能を1つの機能にまとめました。ご協力いただきありがとうございます! – tbg0001