0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

全力回避フラグちゃん! の動画再生数の分布を調べてみた【Python】【グラフ化】

Posted at

はじめに

前回の記事で再生回数をプロットしてみましたが,今回API を用いて自動的にデータセットが作成できるようになったこと,再生回数の分布が単に気になったということで,今回の記事を作成するに至りました.

注意事項

また,2021/1/3 の動画公開前時点で記録しているため,現在の情報と異なる可能性があることと,
とりあえずヒストグラムを使用して分布を見ようとしただけであることをご了承ください.

用いたデータセット

全力回避フラグちゃん! チャンネルからYouTube Data API v3 を用いて取得した再生回数をもとにしました.

プログラム

ヒストグラムを作成するプログラムです.

グラフ作成プログラム
%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import datetime
import matplotlib.dates as mdates
import matplotlib.patches as mpatches
from matplotlib.path import Path
from pandas.plotting import register_matplotlib_converters
register_matplotlib_converters()

bins = 40
maxy = 30

#データセット対象のCSV ファイル
file = "2021-01-03_flag_videos_datasets.csv"
#Date, 再生回数
num_play = pd.read_csv(file, header=0, encoding='UTF8', usecols=[3, 5], parse_dates=[0])
num_play = num_play.dropna(how='all')


# debug
#print(num_play)
#num_play.to_csv('exam_num_play.csv')

#Plot するグラフ
#Date
x = num_play[num_play.columns[0]]
#print(type(x[0]))

#再生回数
y1 = num_play[num_play.columns[1]]

#グラフの大きさ
plt.figure(figsize=(20.0, 10.0), dpi=300)
#フォント設定
plt.rcParams['font.family'] = 'Times New Roman'


# グラフプロット
## 再生回数を棒グラフでプロット
play_hist = plt.hist(y1, bins=bins, color="lightblue")

        
# 軸の範囲
plt.ylim([0, maxy])

# グラフタイトル
plt.title("全力回避フラグちゃん! 動画集計データ", fontname="MS Gothic", fontsize=20)

# 軸メモリ
plt.tick_params(axis='x', labelsize=20, labelrotation=45)
plt.tick_params(axis='y', labelsize=20)

# ラベル名
plt.xlabel("再生回数", fontsize=20, fontname="MS Gothic")
plt.ylabel("数量", fontname="MS Gothic", fontsize=20)

## 平均値と中央値を横線でプロット
avg = plt.vlines(num_play.mean(axis=0), 0, maxy, 'b', linestyles='dashed')

# 凡例
avg_title = "平均値"

plt.legend([avg], [avg_title], bbox_to_anchor=(1.0, 1.0), prop={"family":"MS Gothic", 'size':20}, markerscale=3)

#画像保存
plt.savefig("flag_video_hist_graph.png", bbox_inches="tight", pad_inches=0.0)

#グラフ化した結果

以下のグラフが本記事の成果となります.
横軸が再生回数,縦軸はその再生回数に属する動画の数です.
平均値は小数点以下切り捨てで760, 946 回です.

flag_video_hist_graph.png

簡単な考察?

...グラフの概形を見ると,ポアソン分布に見える...見えなくもない...
まったく存在しない再生回数の階級も存在するが...
サンプルが足りないかもしれないが,これ以上動画はない.

簡単な結論

テキトーになりますが,今回の記事の結論です.

  • 全力回避フラグちゃん! の動画の再生数をヒストグラムとしてプロットすると,ポアソン分布の概形が見えてくる
  • つまり,再生回数はポアソン分布に従う???

今後の予定

今後も日時的に再生数を取得し,ヒストグラム化していく予定です.
新しい発見があったらまた記事を作成します.

おわりに

ここまで読んでいる人はいないと思いますが,もしいたらまずは,以下のリンクから全力回避フラグちゃん! チャンネルとフラグちゃんのTwitter をフォローしてください.この記事を読むより大切なことです.
大事なことなのでもう一度,チャンネル登録Twitter のフォローをよろしくお願いいたします.

関連リンク

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?