1
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

愛犬に「あたしをYoutubeでスターにして!」と言われたので、YoutubeAPIで分析してみた

Last updated at Posted at 2020-08-02

はじめまして。
IT業界初心者なので言葉の定義が間違っている可能性があります。お気づきの点があればアドバイスいただけると助かります。

今年の5月に我が家に犬を迎え、撮影した動画の整理も兼ねてYoutubeをはじめてみました。
はじめるにあたりいろいろな動画をチェックしたのですが、個人の気づきとしては、、、

  • 「Youtubeで生計立てられるんじゃないの?」と思うくらい人気の動物系Youtuberがいる
  • 再生回数と動画のクオリティには、大きな関係はなさそう
    (当たり前かもしれませんが、再生回数100万回超えの動画が、再生回数1万回の動画にくらべて、クオリティが極端に高いわけではない)

という感じで興味深かったので、YoutubeAPIを使って分析することにしました。

分析対象

我が家ではウェルシュ・コーギーという犬種を飼い始めました。

※ かわいいかわいい愛犬のYoutubeはこちら

自分のYoutubeに関連した分析を行いたいので、コーギーに関連する動画ならびにYoutuberを分析対象とします。

今回の記事の対象

今回の記事は以下の人を対象に書いています。

  • 単にコーギーに関する動画の再生回数に興味がある人
  • Pythonにさわったことがあり、YoutubeAPIで何ができるか気になる人

簡単な結論

残念ながら、YoutubeAPIはあまり万能ではなく、分析できる内容が非常に限られてしまいました。まずは「できたこと」を一通り解説します。

できたこと

できたこと 1

Search functionを用いて人気の動画・チャンネルの情報を検索できます。
詳細・コードはYoutubeAPIのリファレンスYoutube Data APIを使ってPythonでYoutubeデータを取得するを参考にしてください。

今回はq='コーギー'、order='viewCount' と指定したので、検索語句コーギーにヒットする動画を再生回数の多い順に取得することに成功しました。

なお、1000件の動画情報を取得しようと試みましたが、Youtube APIの仕様によりできませんでした。
(950件は取得できました。)
また、おおむね再生回数が多い動画が表示されますが、検索するたびに結果が変わります。私が調査した際には、900番目から950番目には再生回数100回以下の動画が多く存在していました。私も再生回数100回以上の動画を投稿しているのですが表示されなかったので、残念ながら検索結果を過度に信頼することはできません。

できたこと 2

videos functionを用いて、videoIdを指定して動画の情報を取得することができます。
詳細はこちらのYoutube Data APIのリファレンスを確認ください。

Youtube Data APIを使ってPythonでYoutubeデータを取得するでは、「できたこと 1」の手法で多くの動画の基本情報を取得し、ここで取得したvideoIdを用いて再生回数やいいねの数を取得しています。

なお、videos functionでチャンネルIDを指定することはできません。
あるチャンネル(たとえばHIKAKINとか)のすべての動画の情報を取得したいと考えたとしても、取得する方法がありません。
ただの実力不足かもしれませんが。。

できたこと 3

channels functionを用いて、Idを指定してチャンネルの情報を検索することができます。
詳細はこちらのYoutube Data APIのリファレンスを確認ください。

また、チャンネルIdを指定することでチャンネルの総再生回数・総いいねの数 等を取得できる関数(以下)を作成しました。

#channelIdを入力することで、そのチャンネルの再生回数やいいね数を取得する関数を作成
def channel_statistics(id):
    statistics = youtube.channels().list(part = 'statistics', id = id).execute()['items'][0]['statistics']
    return statistics

df_static = pd.DataFrame(list(df_channel['channelId'].apply(lambda x : channel_statistics(x))))

df_channel_output = pd.concat([df_channel,df_static], axis = 1)

分析結果

上述した通り分析内容は限られ、結果も頑健ではありませんが、~~せっかく調べたので、~~分析結果も公表します。

コーギー市場は、もはや「コーギー犬ノエさん」の一人勝ち

再生回数が多い動画の情報を950件取得し、よく再生されている上位10チャンネルを動画のアップロード年ごとに比較してみました。
結果、2018年までは群雄割拠の状況でしたが、2019年にすい星のごとく「コーギー犬ノエさん」が現れ、2019年・2020年は2位に圧倒的大差をつけていることがわかります。

channel_10.png

動画をたくさん上げるだけでは、総再生回数はあまり伸びない

「2位に圧倒的大差をつけたノエさんが、動画をもっとも投稿しているのでは?」と考え、上位10チャンネルの総再生回数と総動画投稿数を比較しました。
結果、総再生回数は「コーギー犬ノエさん」がトップでしたが、総動画投稿数は別のチャンネルがトップでした。

viewCount_channel.png

videoCount_channel.png

再生回数といいねの数には相関があるが、よくないねの数にも同様に相関がある

皆さんの推測通り、動画の再生回数が増えるといいねの数が増えます。相関係数は0.87です。

like_view.png

少々意外だったのは、動画の再生回数が増えるとよくないねの数も増えてしまい、相関係数も0.82と、いいねの数と再生関数の相関係数と近いです。

dislike_view.png

おわりに

コーギー犬ノエさんのYoutubeは、北海道&子供&コーギー2匹でとても面白い!
ちなみにほぼ毎日動画を投稿されてます。

動物系Youtuber、厳しい世界なんですね。。。

※ うちの愛犬も、「しょうがないわん。そんなに頑張りたくないわん。」と、人気Youtuberになることを諦めてくれました!
1
3
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?