1
大きなpandasデータフレームテーブルを1Dのpythonリストに変換し、必要に応じてこのリストの重複する要素を削除します。しかし、リストに変換した後、いくつかの要素の繰り返しには、最初に余分なスペースがあり、そのために私の「重複を取り除く」行は効率的ではなく、これらを2つの異なる要素とみなしました。また、番号(nan)でない要素をリストから削除するにはどうすればよいですか? サンプル入力:pandasデータフレームをPythonの1Dリストに変換するときに余分なスペースが発生する
E1 E2 E3
0 A B NaN
1 A C NaN
2 A B C
...
300 X B C
これは私はそれを実行するために使用されるコードレットである:
['A','B','C',....,'X']
( '緑色' は上記の表を含むデータフレーム
MCS2=green.values.tolist()
MCS2=list(set(sum(MCS2,[])))
print(MCS2)
期待出力されます
しかし、何らかの理由でAの中に余分なスペースがあり、AとAのように表示され、同じでも2つの異なる要素としてカウントされます。これは私のouですTPUT:
['A',' A','B','C',' C'....,'X']
それはまだ同じ問題を@jezraelを持っています。正面に余分なスペースがあるため、いくつかの要素が新しいリストに複数回表示されます。 – controlfreak
@jerzaelありがとうございました!今それは動作します! – controlfreak