重要度を表す値の範囲にスケールする必要があるNxN DataFrameがあります.0は無関係、3は非常に重要です。Pandas DataFrame:列の最小値/最大値に基づいて値を計算する
私はもちろん、各列の最小値と最大値に依存します。Col Aの範囲は1〜12、Col Bの範囲は1M〜45Mです。
私が使用している式は次のとおりです。
min_importance + ((max_importance - min_importance)/(max_spec_value - min_spec_value)) * (spec_value - min_spec_value)
識別のために、後に必要とされているインデックスを、保持しつつ、どのように私は、各列のスケーリングされた値を持つ新しいデータフレームや辞書を作成するのですか?
上記の式で関数を作成し、apply()を使用して各行の関数を呼び出そうとしましたが、min/max列を関数に渡すことができません。
データフレームのサンプル( "ボディ:小売価格" と "ボディ:センサーの解像度は" 列です):
Body: retail price Body: sensor resolution Body name Nikon D500 2000.00 20668416 Nikon D7000 1200.00 16084992 Sony Alpha 7R II 3199.00 42177408 Canon EOS 5D Mark III 3499.00 22118400 Canon 7D Mark II 1799.00 19961856 iPhone 6 (front) 699.00 1000000 iPhone 6 (rear) 699.00 7990272 Fujifilm X-T1 1299.95 15980544 Fujifilm X-T2 1599.00 24000000
'pd.cut'を使用して各列にビンを割り当てることはできますか? –
DataFrameのサンプルを投稿できますか? – ayhan
@ayhan元の質問にサンプルを追加しました。 – seadragon