2017-12-31 206 views
-2

私はここでnoobie質問plt 。散乱。plt.scatter(X [:50,0]、X [:50,1]、color = 'red'、マーカー= 'o'、ラベル= 'setosa')

私は2つの花の花びらの長さを分析している機械学習チュートリアルに取り組んでいます。

df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data', header = None) 
print(df.tail()) 

y = df.iloc[0:100,4].values       #This is going to print out the 5th column of the dataset. 


y = np.where(y == 'Iris-setosa', -1, 1)    #Where y has 'Iris-setosa' in there, it is going to yield a -1. Else it is going to yield a 1. 


X = df.iloc[0:100, [0,2]].values     #1st and 3rd column of the Iris dataset online 
              #printout the 1st and 3rd 

plt.scatter(X[:50,0],  X[:50, 1], color = 'red', marker = 'o', label = 'setosa') 


plt.scatter(X[50:100, 0], X[50:100, 1], color = 'blue', marker = 'x', label = 'versicolor') 

plt.scatter線の各々のために、2 Xがあるなぜ私はかなり得ることはありません[:50.0]とX [:50、1]。それの目的は何ですか?私は、散布図を作成するときにplt.scatterがアイテムの1つのタイプを表示することを意図していると考えました。私はそれが何かのようになると思ったように。この上の任意の入力のため...ようにし、事前に

感謝を...

:[50.0]あなたが行0から50まで、あなたはとてもそのちょうどXの特定の花PLT散乱したいことを知っています

enter image description here

+0

こんにちは。私はそれがデータに依存すると思う。最初にデータを知っておく必要があります。散布図は、2つの変数間の*関係*を視覚化するために使用できます。この場合、2つの測定値は「X」の1列目と2列目の値です。お役に立てれば。 – Arief

+0

はい、少しです。私が混乱しているのは、X [:50,0]、X [50,1]、color = 'red' ....のような理由です。どのようにplt散布図がそのコード行から赤色になるのかを知ることができます。 – ghostinashell

+0

コードを実行しましたか?結果は何ですか? – Arief

答えて

0

データは2 X 50アレイに格納されます。したがって、X [50,0]は幅50のリーフで、X [1,50]は同じ50のリーフの長さです。したがって、たとえば、幅と長さをプロットすることができます。その組み合わせは1つのプロットセットを構成します。データは赤丸で示されます。

+0

ああ..私は今それを見ます...まあ、それは私のばかなことでした。 :50,0、および:50,1。 0と1はデータソースの列を参照していました。私は今それを見る。ありがとう。今すぐクリック! ありがとうございます。 – ghostinashell

+0

ダムではありません。私がPythonを学んでいたとき、それについて考える必要がありました。 – jmh