5
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Ateam Finergy Inc. × Ateam Wellness Inc. Advent Calendar 2023

Day 25

2023年度QiitaアドベントカレンダーOrganizationカテゴリのデータ分析

Last updated at Posted at 2023-12-24

メリークリスマス🎅🎄
株式会社エイチームフィナジーの @Adacchi3 です。
本記事はAteam Finergy Inc. × Ateam Wellness Inc. Advent Calendar 2023の25日目の記事になります。

はじめに

今年のアドベントカレンダーの季節も最終日です。
Qiita Advent Calendarとは、毎年12月1日から25日までの期間限定で展開される記事投稿イベントで、アウトプットの良い機会になる行事です。

今年も参加しているのですが、せっかくアドベントカレンダーの記事をQiitaに投稿するのであれば、いいね数がほしい…!
そんな気持ちも心の片隅にあるわけです。

アドベントカレンダーでいいね数をいただいている記事とは、どういった記事なのでしょうか。
「推測するな、計測せよ」という言葉があります。
今回は2023年度のOrganaizationカテゴリーのアドベントカレンダー記事を対象に、計測・分析することによって、トレンドや特徴を確認し、記事作成の参考となる情報を提供したいと思います。

2022年度の分析と同様のことをしていきます。差分を見ながらお楽しみください。

対象データ

今回は2023年12月22日1:45頃時点にて、2023年度Organizationカレンダーランキングのいいね数順にリストアップされている20企業にてQiitaに投稿された776記事を対象とします。

アドベントカレンダーを1つずつ手作業で開き、Qiitaに投稿されている記事を目視で精査して、URLの一覧を作ります。引き続き2時間かかりました。
その後、IDを抽出しQiita API v2を通してタイトルや記事本文、いいね数を取得しました。

統計情報

776記事の統計情報としては以下のとおりです。
外れ値になり得る記事も含まれているため、平均値・中央値・最小値・最大値で算出しております。

属性 平均値 中央値 最小値 最大値
いいね数 29.59 16 1 1,073
ストック数 17.27 2 0 1,270
タグ数 3.37 3 1 5
本文の長さ 6,907.06 4,585 430 162,762

いいね数に関しては16いいねが目標となり得るようです。

タグ数に関しては最小1, 最大5の制約があるため、平均値や中央値が3となっています。

本文の長さを算出しておりますが、エンジニア記事の特徴的な部分としてソースコードが含まれていることもあるので参考程度に捉えてください。

グラフ

いいね数と各属性でグラフにプロットしてみて、特徴的だったグラフを示します。

いいね数と本文の長さ

2023-like-count-x-body-length-ss.png

縦軸がいいね数、横軸が本文の長さになります。

いいね数と作成日

2023-like-count-x-created-date.png

縦軸がいいね数、横軸が作成日になります。

一部外れ値があったため、グラフのプロットから除外しております。
引き続き、12月以前に準備していた記事があることがわかります。

頻出語彙

最後にタイトル、タグ、本文記事にてワードクラウドを作成しました。

形態素解析としてjanome、ワードクラウド作成にwordcloudといったライブラリを用いてPythonで作成していきました。

タイトル

title.png

エンジニアの単語が大きくあります。他にも開発方法機能といった単語が見受けられます。

テクニカルな単語としては、GASRailsBigQueryとかでしょうか。2023年に話題となっていたLLMもあります。

込み入ったテクニカルな単語はあまりなく、汎用的な表現が多い印象を受けました。

タグ

tags.png

大きくAdventCalendar2023があります。困ったときにはアドカレタグを使うといいのかもしれません。

また、タグのほうでChatGPTLLMOpenAIといった今年流行った生成系AIの単語があります。

本文

ストップワードがない状態

body.png

ストップワードを設定していない場合、httpspng, imageといった単語が見受けられます。
画像を使ってわかりやすく説明している記事が多いことがわかります。引き続きですね。

ストップワードがある状態

bodyWithStopWord.png

目視でストップワードのリストを作成し、除外した図になります。
エンジニアでよく使われる単語が多く見られました。昨年度と皆さんが使っている単語は大きく変わってないように見受けられますね。

おわりに

Qiitaアドベントカレンダー2023年度のOrganizationカテゴリーの上記記事を分析しました。

  • 文章量はいいね数をあまり関係ない
  • タグに困ったらアドカレタグを付けよう
  • 画像を使ってわかりやすく説明しよう
  • 2023年はChatGPTやLLMといったタグの記事が登場した

以上の事柄が計測・分析を通して把握できました。

クリスマスが終わったら年末年始です。みなさん良いお年を!

5
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?