2017-03-19 8 views
1

dfのpython ggplot geom_barのy軸の値が正しくない

duration status line 
75526 Good  A 
75526 Muy buen B 
75546 pas mal C 
75516 loco  D 

私は経由してプロットしています:、私はy軸を確保するためにstat='identity'を使用しています。重要な

p = ggplot(aes(x='status',weight='duration',fill='line'),data=df) + geom_bar(stat='identity') 

は、列の値ではなく、いくつかあります密度測定。しかし、それは間違ったy-axis値を表示しています。

最大durationの値を計算できますが、これは86,000マーク(24時間単位)の周りに表示されています。プロットが250,000を超える秒数を表示するのはなぜですか?

enter image description here

+0

上記の情報から、私はパンダを使ってデータフレームとプロットを以下のように使用しました:https://s24.postimg.org/rxrz9q3t1/Screen_Shot_2017-03-26_at_9.15.25_PM.png。私は何の問題も見ません、もっと説明できますか? – igaurav

+1

あなたのデータフレームには、 'status'と同じ' line'というエントリがあり、その期間はプロットのために合計されます。この場合、実際に何をしたいのですか? – gereleth

+0

ビンゴ@ゲレレス。お気軽に回答を投稿してください;) – LearningSlowly

答えて

1

このプロットはstatuslineによってグループにデータフレームを行くと、バーの高さとして、各グループに(重み別名)時間の合計を使用しています。いくつかのグループには複数のエントリが必要です。

0

私はあなたがそれを提供している不完全な情報から推測しています。あなたがy軸に制限を置きたい

、あなたが ylim(low=0, high=864000) ようylimメソッドを使用することができ、そのためにだからあなたのコマンドでは、これが正しいなら、私に教えてください

p = ggplot(aes(x='status',weight='duration',fill='line'),data=df) + geom_bar(stat='identity') + ylim(low=0, high=864000)

のように表示されますすること。

乾杯

関連する問題