データに関する記事を書こう!
テーマ2『データに関する記事を書こう!』参加記事です。
データの件数が10件、30件、100件と三段階で分析してみるとよいという経験則があります。
データ件数10,30,100。三段統計活用法
Qiita記事三段階分析10,30,100 (1)
【毎日自動更新】データに関する記事を書こう! LGTMランキング!
で、データが100件になる前に、予備分析をしてみようかなって思います。
「@torifukukaiou 【毎日自動更新】データに関する記事を書こう! LGTMランキング!」
まだ、30件データが揃っていない状況では、自分以外の人からのリンク数が大事そうだということが推測できました。
与件網(data network)が凡人網(ordinary people network)
投稿者ごとの記事数は分析対象にしない。
行事の趣旨として、記事数の要請があるわけではないから。
投稿者ごとのLGTM数と記事数
No. | user | LGTM | Count | L/C |
---|---|---|---|---|
1 | @kaizen_nagoya | 30 | 41 | 0.73 |
2 | @keiji_dl | 19 | 4 | 4.75 |
3 | @hanaseleb | 13 | 4 | 3.25 |
4 | @torifukukaiou | 12 | 4 | 3 |
投稿者ごとのLGTM数では、1記事あたりのLGTM数を計算してみた。
何か意味があるわけではない。引き算でも、割り算でも、なんでもいい。
データ間の演算を見て感じることがあればよい。
タグごとの記事数とLGTM数
No | tag | count | LGTM | L/C | total tag | C/Total |
---|---|---|---|---|---|---|
1 | Qiitadelika | 55 | 85 | 1.54 | 60 | 91.6 |
2 | AdventCalendar2022 | 44 | 41 | 0.93 | 331 | 13.2 |
3 | データ分析 | 15 | 15 | 1 | 2,061 | 0.7 |
4 | データサイエンス | 11 | 26 | 2.36 | 1,234 | 0.8 |
タグごとの記事数は、どういうタグに人気があるかを確認するとよい。
社会事象は受動測定は不可能である。
能動測定の能動の意思をつかむことが分析の鍵の一つになる。
Qiita全体で、そのタグがどれくらいの記事数があるかをTotal tagに記録した。
タグごとのLGTM数と記事数
No | tag | LGTM | Count | L/C | total tag | C/Total |
---|---|---|---|---|---|---|
1 | Qiitadelika | 85 | 55 | 1.54 | 60 | 91.6 |
2 | AdventCalendar2022 | 41 | 44 | 0.93 | 331 | 13.2 |
3 | Python | 28 | 6 | 4.66 | 62,687 | 0 |
4 | データサイエンス | 26 | 11 | 2.36 | 1,234 | 0.8 |
5 | delika | 21 | 8 | 2.62 | 9 | 88.8 |
6 | Microsoft | 19 | 4 | 4.75 | 1,023 | 0.3 |
7 | テキストマイニング | 16 | 1 | 16 | 81 | 1.2 |
8 | データ分析 | 15 | 15 | 1 | 2,061 | 0.7 |
9 | 40代駆け出しエンジニア | 12 | 4 | 3 | 90 | 4.4 |
10 | PowerPlatform | 10 | 3 | 3.33 | 313 | 0.9 |
Pythonは、元記事が多く、0.009%で限りなく0に近い。