QiitaAPIv2のおかけで、Qiitaの記事をある程度取得出来るようになったので色々分析してみたいシリーズです。Qiitaだけでなく、はてぶとの相関も調べてみます。
感覚的にはたくさんストックされた記事は当然はてぶもたくさん付いておりますが、本当にそうなのか実際に分析してみました。
事前準備(データ取得)
Qiitaの記事はQiitaAPIv2で1万件取得しました。それについては、以前の記事でも簡単に触れています。
はてぶははてなブックマーク件数取得APIで取得しました。特に利用制限は無いのか、1万件についてすぐに取得できました。
分析結果
散布図
以下、まず散布図を示します。大方、被ストック数が多い記事は被はてぶ数も多い気がします。
相関係数
次に、相関係数を調べてみると、相関係数は「0.89」でした。
相関係数は、以下のように判断出来るようなので、被ストック数と被はてぶ数の相関は強い、と言えそうです。
(ちなみに相関係数はExcelの機能で調べました。)
相関係数 | 相関の強さ |
---|---|
0.7> | 強い(ここ!) |
0.4-0.7 | 中間の強さ |
0.2-0.4 | 弱い |
0.2< | ない |
各被ストック数(範囲)に対する被はてぶ数の平均
具体的に数値として、各被ストック数(範囲)に対する被はてぶ数の平均を出してみました。まあ感覚通りかなという気がします。
※追記
両方のグラフの目盛を対数にしてみました。