1
2つの異なるワードで構成されたデータが2つの別々のセルに分割されたエラーが発生したデータフレームがあります。例:エラーが発生したフレーム。例:同じ行の文字を含むセルが1つのセルに結合されます
col1 col2 col3 col4 col5
0 A 1 2 3
1 B C 3 4 5
2 D 6 7 8
3 B E 9 10 11
Iは、同時に左の行のすべての残りの部分を移動させながら、同じ行からの細胞から文字が1つのセルに結合する接続たいです。フォームで結果を取得するには、次の
col1 col2 col3 col4 col5
0 A 1 2 3
1 B C 3 4 5
2 D 6 7 8
3 B E 9 10 11
私は今df.replace(['C', 'E'], [np.nan, np.nan], regex=True)
を使用して、後でdf.iloc[[n]].dropna(axis=1, how="any")
列によってよ。しかし、これは私が手の上にあるため例では、理想的ではありません。
col1 col2 col3 col4 col5
0 A 1 2 3
1 B 3 4 5
2 D 6 7 8
3 B 9 10 11
だから、実際には真実ではない、同じ名前、2行。彼らはそれぞれ「B C」と「B E」と呼ばれるべきであるからです。また、データに応じてNaNに切り替えるためにセル名を手動で入力する必要があるたびに、 アイデアはありますか?
少しツイストここで変更する作業が、それは動作します:)今私はを取り除くためにしようとしていますcol1_0行。 –
@TomaszPrzemski https://stackoverflow.com/questions/22233488/pandas-drop-a-level-from-a-multi-level-column-index – Wen
私が今見つけたのは –