これまでのところ、データフレームに存在するすべての列名のリストを取得したり、そのデータ型に基づいて特定の列名を取得したりできました。開始文字などPython - Panda Dataframeの列のリストから列名を動的に除外する方法
私の要件は、列名またはサブリストの全リストを取得し、そこから1つの列を除外することです(ターゲット変数/ラベル列)。これは機械学習の一部です。機械学習で使用されている用語を使用しています)
ご注意ください。これらの列にあるデータについては言及していません。私は、列名を取って、より良く理解するための例は、以下を参照してください
その名前で特定の列を除外したいのです:
私は上記のコマンドの両方を引いています残りのカラム名を取得するINORDER今# Get all the column names from a Dataframe
df.columns
Index(['transactionID', 'accountID', 'transactionAmountUSD',
'transactionAmount', 'transactionCurrencyCode',
'accountAge', 'validationid', 'LABEL'],
dtype='object')
# Get only the Numeric Variables (Columns with numeric values in it)
df._get_numeric_data().columns
Index(['transactionAmountUSD', 'transactionAmount', 'accountAge', 'LABEL'],
dtype='object')
string_cols = list(set(list(df.columns))-set(df._get_numeric_data().columns))
これをヒットするまで、すべてうまくいく。
ラベルの列には数値がありますが、数値変数のリストには存在しないはずです。それは除外すべきです。
(すなわち)は、私は次のようなもののような無駄だったようなステートメントを試してみました
(リスト内のインデックスを使用しますが、明示的にその名を使用していない)特定のカラム名を除外したいです。これに関するすべての入力は役に立ちます
set(df._get_numeric_data().columns-set(df.LABEL)
set(df._get_numeric_data().columns-set(df.LABEL.column)
set(df._get_numeric_data().columns-set(df['LABEL'])
私は非常に基本的なものを見逃していますが、それを理解することはできません。
ここでいくつかの素晴らしいトリック、共有ありがとう。 –
ようこそ@andrew_reece( - : – piRSquared
素晴らしいです。ありがとうございます@piRSquared – JKC