Pandas DataFrameから散布図を作成

私はPandas DFに関する質問に取り組んでいますが、散布図を作成するために、いくつかのPandasデータを使用可能な形式に変換する際に問題があります。Pandas DataFrameから散布図を作成

以下のコードは、私が間違っていることを教えてください私が初心者なので、正直な批判が必要です。

# Import Data 
df = pd.read_csv(filepath + 'BaltimoreData.csv') 

df = df.dropna() 
print(df.head(20)) 
# These are two categories within the data 
df.plot(df['Bachelors degree'], df['Median Income']) 

# Plotting the Data 
df.plot(kind = 'scatter', x = 'Bachelor degree', y = 'Median Income') 
df.plot(kind = 'density')

出典

2017-10-22 Brandon

は、データのコードを、お忘れですか？印刷してください（df.head（20））。ここに出力してください。 –

見出しを追加したので、最初の20行のデータを見ることができます。 – Brandon

残念ながら、私はあなたのコンピュータにアクセスすることができないので、ファイルパスからデータを読み込むことができません。今回はあなたの問題が解決されたようですが、将来的に[mcve]を提供する方法を見てみると、より良い回答を得ることができます。 –

以下のようにyの上だけでプロットのx、DFはあなたのデータフレームxとyここで、あなたの従属変数と独立変数されています

import matplotlib.pyplot as plt 
import pandas 

plt.scatter(x=df['Bachelors degree'], y=df['Median Income']) 
plt.show()

出典

2017-10-23 14:47:45 Johnnyh101

私はそれを実行すると、次のエラーメッセージが表示されます：文字列を浮動小数点に変換できませんでした： '$ 37,678' – Brandon

まあ、あなたは文字列としてフォーマットされたMedian Incomeを持っています - read_csvはドル記号を検出していて、すなわちテキスト）。単にCSVの数字としてフォーマットされるように変更することができます。 – Johnnyh101

パンダのscatter plotを使用できます。

import pandas 
import matplotlib.pyplot as plt 
plt.style.use('ggplot') 
df.plot.scatter(x='Bachelors degree', y='Median Income'); 
plt.show()

出典

2017-10-22 23:19:40

それは次のようになりますので、だから私は、コードにいくつかの調整をした： df.dropna（軸= 0、どのように= '任意の'） plt.style.use（ 'ggplot'） df.plot.scatter（ plt.show（）しかし、それでもNA/NaN値を含むベクトルではインデックスできないというエラーが表示されます。 – Brandon

Pandas DataFrameから散布図を作成

答えて

関連する問題