はじめに
Qiitaで記事を投稿すると、Twitterでもシェアすることが多いです。では、「Qiitaでのいいね数」と「Twitterでのいいね数」には、どれほどの相関があるのでしょうか?
本記事では、2024年12月03日時点で取得したデータを用いて、Qiita記事のいいね数と、同記事をシェアしたTwitter投稿のいいね数を比較し、相関分析を行います。
留意事項:
- 記事によって公開からの経過日数が異なり、同条件での比較は困難です。
- 本記事で扱うのは「いいね数」のみであり、Twitterのリツイート数やQiitaのストック数などは対象外です。
使用データと手順
データ概要
-
tweets.csv
:
Twitterでシェアした記事タイトルと、その際のツイートいいね数が記録されたCSV。
-
qiita_articles.csv
:
Qiita上での記事タイトルといいね数が記録されたCSV。
これら2つのCSVを「記事タイトル」で紐付け、対応する記事ごとに「Qiitaいいね数」と「Twitterいいね数」を取得します。
データ分析に用いたソースコード
import pandas as pd
import plotly.express as px
# データ読み込み(サンプル)
qiita_df = pd.read_csv('qiita_articles.csv')
tweets_df = pd.read_csv('tweets.csv')
qiita_df = qiita_df[['タイトル','いいね数']].rename(columns={'いいね数': 'Qiita_likes'})
tweets_df = tweets_df[['記事タイトル','いいね数']].rename(columns={'いいね数': 'Twitter_likes'})
merged_df = pd.merge(qiita_df, tweets_df, left_on='タイトル', right_on='記事タイトル', how='inner')
fig = px.scatter(
merged_df,
x='Twitter_likes',
y='Qiita_likes',
hover_data=['タイトル'],
title='Twitter Likes vs Qiita Likes'
)
# Annotationsを追加
for i, row in merged_df.iterrows():
fig.add_annotation(
x=row['Twitter_likes'],
y=row['Qiita_likes'],
text=row['タイトル'],
showarrow=False,
textangle=-45, # テキストを45度回転
xanchor='left', # 配置調整は適宜
yanchor='bottom',
xshift=5, # 点から少しずらすなど微調整
yshift=5,
)
fig.update_layout(
xaxis_title='Twitterいいね数',
yaxis_title='Qiitaいいね数',
hovermode='closest'
)
fig.show()
# 相関係数の計算
corr = merged_df['Twitter_likes'].corr(merged_df['Qiita_likes'], method='pearson')
print(f"ピアソンの相関係数: {corr:.2f}")
上記コードを実行すると、
- 散布図が表示され、Qiitaいいね数(y軸)とTwitterいいね数(x軸)の分布が可視化されます。
-
corr
で相関係数(ピアソン相関)が算出されます。
結果と考察
ピアソンの相関係数: 0.04
- 算出された相関係数は約0.04で、「ほぼ相関がない」ことが分かります。つまり、Twitterで多数のいいねが得られた記事が、必ずしもQiitaでも同程度に評価されるわけではなく、その逆も成立しません。
プラットフォーム間の差異について
- 読者層の違い:Qiitaは幅広いITエンジニアを対象としており、技術的に汎用的なテーマが受けやすい傾向があります。たとえば「ポケポケに登場する確率分布」はQiitaで非常に高い反響を得ましたが、Twitter上では相対的に控えめとなりました。
- 関心分野の偏り:筆者のTwitterアカウント(@ねぼすけAI)はAI分野に関心を持つフォロワーさんが多く、AI関連の記事(例:Optunaを用いたプロンプトエンジニアリング、LLMコンペの取り組み方など)がTwitterでいいねが多い傾向があります。しかし、これらのAI関連記事はQiita上で必ずしも同様の評価につながるとは限りません。
- その他の要因:記事の公開時期や拡散チャネルの違い、Qiitaアカウント未ログインでいいねが押せない仕様なども、両プラットフォーム間での評価差に影響していると考えられます。
まとめ
今回の分析から言えることは、「Twitterいいね数」と「Qiitaいいね数」の間に相関は見られず、ほぼ独立していると言えます。これは、プラットフォームごとに読者層や関心分野が異なることが大きな要因と考えられます。
いいね数はあくまで参考指標の一つであり、それ自体に一喜一憂する必要はありません。今後も、読者の方にとって価値ある記事を投稿できるように心がけたいと思います。