2017-10-22 16 views
0

私はPandas DFに関する質問に取り組んでいますが、散布図を作成するために、いくつかのPandasデータを使用可能な形式に変換する際に問題があります。Pandas DataFrameから散布図を作成

以下のコードは、私が間違っていることを教えてください私が初心者なので、正直な批判が必要です。

# Import Data 
df = pd.read_csv(filepath + 'BaltimoreData.csv') 

df = df.dropna() 
print(df.head(20)) 
# These are two categories within the data 
df.plot(df['Bachelors degree'], df['Median Income']) 

# Plotting the Data 
df.plot(kind = 'scatter', x = 'Bachelor degree', y = 'Median Income') 
df.plot(kind = 'density') 
+3

は、データのコードを、お忘れですか?印刷してください(df.head(20))。ここに出力してください。 –

+0

見出しを追加したので、最初の20行のデータを見ることができます。 – Brandon

+0

残念ながら、私はあなたのコンピュータにアクセスすることができないので、ファイルパスからデータを読み込むことができません。今回はあなたの問題が解決されたようですが、将来的に[mcve]を提供する方法を見てみると、より良い回答を得ることができます。 –

答えて

0

以下のようにyの上だけでプロットのx、DFはあなたのデータフレームxとyここで、あなたの従属変数と独立変数されています

import matplotlib.pyplot as plt 
import pandas 

plt.scatter(x=df['Bachelors degree'], y=df['Median Income']) 
plt.show() 
+0

私はそれを実行すると、次のエラーメッセージが表示されます:文字列を浮動小数点に変換できませんでした: '$ 37,678' – Brandon

+0

まあ、あなたは文字列としてフォーマットされたMedian Incomeを持っています - read_csvはドル記号を検出していて、すなわちテキスト)。単にCSVの数字としてフォーマットされるように変更することができます。 – Johnnyh101

0

パンダのscatter plotを使用できます。

import pandas 
import matplotlib.pyplot as plt 
plt.style.use('ggplot') 
df.plot.scatter(x='Bachelors degree', y='Median Income'); 
plt.show() 
+0

それは次のようになりますので、だから私は、コードにいくつかの調整をした: df.dropna(軸= 0、どのように= '任意の') plt.style.use( 'ggplot') df.plot.scatter( plt.show() しかし、それでもNA/NaN値を含むベクトルではインデックスできないというエラーが表示されます。 – Brandon

関連する問題