Qiita
PHP
タグ
統計学

Qiitaで多いタグを1年前と最近とで比較してみた

概要

Qiitaの投稿に付与されたタグを集計し、1年前と比較して、最近増えたタグを確認してみた。
具体的には、1年前と直近の1ヶ月分(8月22日~9月22日)の投稿を全て取得し、それらに付与されているタグを集計した。
このような内容を集計すれば、最近の実際に手を動かしてみるレベルのトレンドが分かるような気がする。

環境

  • Qiita APIv2
  • PHP

手順

  • 1年前と直近の1ヶ月分の投稿を全て取得する(PHP、以下にサンプルコード)
  • それらに付与されたタグを全て抽出する(PHP)
  • 1年前と直近とで、タグ数を集計する(Excel)

サンプルコード(抜粋)

  • query で期間を指定する。
  • page で100件ごとの投稿が取れるので、ここはプログラムの中で変数で増やしていく必要がある(今年の8月22日~9月22日であれば、6500前後の投稿があったので、1~65前後指定して繰り返す必要がある)
test.php
$curl = curl_init("http://qiita.com/api/v2/items");
$json = [
      "page" => 1,
      "per_page" => "100",
      "query" => "created:>2016-08-22 created:<2016-09-22"
 ];
$option = [
    CURLOPT_CUSTOMREQUEST => 'GET',
    CURLOPT_RETURNTRANSFER => true,
    CURLOPT_POSTFIELDS => json_encode($json),
    CURLOPT_HTTPHEADER => [
      'Authorization: Bearer xxxxxxxx', //アクセストークン
      'Content-Type: application/json',
    ],
];
curl_setopt_array($curl, $option);
$result = curl_exec($curl);
$json_result = json_decode($result, true);
curl_close($curl);

結果

1年前多かったタグ数ベスト10

1年前.png

直近で多かったタグ数ベスト10

直近.png

1年前と比較すると、

  • Python3
  • docker

が入ってきている。あと、全体的な投稿数自体も増えているみたい。
やはり全体としてWeb系のプログラミングが多い印象。

1年前との比較で増えた数の多いタグ数ベスト10

比較.png

直近のタグ数-1年前のタグ数を算出し、多い順にベスト10を並べたみた(したがって、絶対数が少なくても、比較して数が多いタグが含まれる)。
やはりPython3系が多くなっていることと、機械学習、kotlin、DeppLearning、Blockchain等、最近HOTっぽいキーワードの投稿は増えたようである(自分はスマホプログラミングは特に疎いので、kotlinに関しては全く知らなかったけど)。
というわけで、時々比較してみると、最近のトレンドが反映されていて、面白い気がする。