##起こった現象
###matplotlibで折れ線グラフ形式でプロットした所、0のラインにアンダーの線が発生した。
データの内容
①ある店舗の売り上げ個数
②2013年1月から1ヶ月ごと0、1、2、3・・・続き最終的に2015年10月を3とする
##プロットした結果
#考察
x軸は、②
Y軸は、①を示している。
折れ線グラフ作成をもとに考察すると、売り上げ個数としてカウントする際には考えられない、小数点第一位までグラフにプロットされていることがわかる。無論、売り上げ個数としてカウントする際に小数点第一位まで出てくることはありえない(一つの製品を半分にして販売されることはないため)
##自分なりの理想の形から考えてみる
あ、、、れ。。
黄色の線を付け足している際に気づいたが普通の折れ線グラフの場合、一つの値に対して一つの情報が含まれているから正確に折れ線が作成されていることに気づく。
どういうことかというと、今回x軸の1-30までの値から考えると
x軸の1は
2013-1月1,2,3,4,5,6,・・・と続いている。つまりここでは1は最大31日分の売り上げ情報が含まれていることがわかる。つまりできるだけグラフを読み取るためには、上記で示した黄色の線の1ヶ月の売り上げ個数の中央値をとる必要があるのではないか??と考え黄色の線を付け足した。
↑の時点で正確に一般的にみる形でかつ正確な折れ線グラフを作成することは不可能。
##どうするか??
折れ線グラフでプロットはできなそうなので棒グラフで表現しようとした。が。。。
macbook proが処理できない?!?!
ということで諦めて、date(1日ごとの日付)で表してみた。
このグラフに関しては、1日ごとのデータつまり(365×2)+(10×30)と小さく見積もっても合計1030日と計算できる。そのためデータを表すことが難しく、プロットしても見えづらい。>だから33の番号で振り分けていたのかもしれない。横にかなり引っ張ることで詳しく見れるかもしれないがこれも私のmac book proの性能の問題か?横に伸ばし過ぎるとグラフが真っ白になる。
##ーーーーー考察結果ーーーーーーー
##一応調べた結果も。
;pythonのバージョンが違うことによるバグによって変な表示に?
;数値データとして扱われていない場合に変な表示に?
今回の問題にはあまり関係がなさそうに思えた。
##結論
最初のグラフに関しては、折れ線グラフの基本となるデータの点が一つに決まらないため点が0と認識され、点同士を繋げた時に0のアンダー線が出現するのではないだろうか?
x軸の一つの数値に複数のデータが含まれている場合、折れ線グラフが正しく表示されない?のではないか?という結論に至りました。時系列データを使用する時には一つの数値に一つの情報が含まれているかを確認するべきで今回の場合では、折れ線グラフの形式でのプロットはナンセンスだったのではないだろうか。
##matplotlib初心者のため
##「いや、それ違うよ」という意見がありましたらコメントして頂けますと幸いです。