異なるデータ型のPandas df
がある場合、df.select_dtypes
は、特定のアプリケーションで望ましくない列を保持したり、不要な列を取り除くのに非常に役立ちます。pandas df(df.select_dtypesに相当)の文字列を選択する
しかし、この方法を使用してstring
dtypesに対処する方法はないようです。 the docsから
(強調鉱山):
とValueErrorの両方が含まれ、除外
あらゆる種類の場合は、重複要素を包含および除外している場合
を空の場合
文字列dtypeが渡されます。
と
は、それがあるものの
df.select_dtypes(exclude=['str'])
が(エラーが発生します使用して、あなたがオブジェクトDTYPEを使用しますが、これは
すべてオブジェクトDTYPE列
実際
を返すことに注意しなければならない文字列を選択するにはTypeError
であり、ValueError
はドキュメントの主張ではありません)、df.select_dtypes(exclude=['object'])
を使用すると、string
列だけでなく、すべてobject
列が削除されます。
df = pd.DataFrame({'int_col':[0,1,2,3,4],
'dict_col':[dict() for i in range(5)],
'str_col':list('abcde')})
と
df.dtypes
がstr_col
とdict_col
の両方にobject
であることを考慮:
除くかの最良の方法は何ですか、このようなdf
考える
すべてのストリンを含むg列? df.applymap
とtype
、及び等化を使用
いいだろう、ありがとう!完全性のために、文字列を実際にインクルードするか除外するかは 'df.loc [:、(df.applymap(type)== str).all(0)]'と 'df.loc [:, (df.applymap(type)!= str).all(0)] 'となります。 – WhoIsJack
@WhoIsJack That、または列のインデックス(私の答えに追加)。 –