列が文字列の値を変更するたびにデータフレームの行にフラグを付けるにはどうすればよいですか?Pandas "diff()" with string
例:
入力
ColumnA ColumnB
1 Blue
2 Blue
3 Red
4 Red
5 Yellow
# diff won't work here with strings.... only works in numerical values
dataframe['changed'] = dataframe['ColumnB'].diff()
ColumnA ColumnB changed
1 Blue 0
2 Blue 0
3 Red 1
4 Red 0
5 Yellow 1
パフォーマンスノートを:単に 'np.bool'タイプの代わりに整数を使用する方がよいかもしれません。 'np.bool'は1バイトを使います。私はあなたが 'np.int8'を使うことができると思いますが、デフォルトでは' np.int64'や 'np.int64'(システム上のC言語が何であっても)が使われていると思います... –