1.はじめに
Qiita への投稿を開始して1年。 Github へのコミットを開始して半年。
最近とても気になることが出てきたため、データ分析の技術は有りませんが、メモがてら思いついたことや考察だけをツラツラとココに書き流します。
ココに書く内容は全て、定量的な分析に基づく厳密な評価ではなく、自身の官能評価に基づく内容しか含まないため、厳しいご指摘はご遠慮いただきたいと思います。
題名に比して、内容はかなり薄っぺらです。
別にデータサイエンティストを気取っているわけではありません。
ただ純粋に気になって仕方がなかっただけです。
そもそも、QiitaとGithubを同じ土俵で比較すること自体が間違っている、と薄々感じていますが、まぁそんなに冷たいことを言わないで適当に流してやってください。
決してアカデミックな内容では無いため、期待しないでください。
一応、ゴミ記事と揶揄されることは想定の範囲内です。
私は別に、Qiitaが良いとかGithubが良いとかそういうことを考えているのではありません。
2.気になったこと
- Qiita上の「いいね」数がゼロ〜数件のコード記事に対し、Github上では数十件の「Star」が付くことが有る。
- Qiita記事よりもGithubのコードに対する反応のほうが早く、「Star」数も多くなりがち。
- Github上で数Starしか獲得できないコードや手順でも、Qiita上では十〜数十「いいね」付くことが有る。
3.Qiitaについて
- エモーション要素が多く含まれる記事への「いいね」獲得数が多い気がする。
- (1)万人がとてもオモシロ可笑しく読める、(2)超真面目な技術考察、(3)斬新、(4)便利、(5)思いもしない気づきが与えられる、このあたりが「いいね」数に大きく寄与している気がする。
- 建前上は日本人向け。利用者は概ね日本人。
- コードや手順の内容よりも「面白さ」に対して評価が付く感覚。
- コードを書いてもあまり内容を見られていない感覚。(コードの貼り方や書き方、解説の丁寧さ、で露骨に差が出ています。)
- 「いいね」は『技術力』の評価指標とは成り得ない、気がする。むしろ、人を惹きつける『表現力』が評価指標となっている気がする。
- 記事に対するコメント・指摘の数がすさまじく少ない。アカデミックな内容に対するコメントは比較的多いような気がする。あと、ポエムも。
- 記事を書いた直後から、圧倒的なスピードで埋もれる。目にも触れられない。
- SEOの破壊力が高すぎてGoogle検索からの流入が圧倒的に多い。
- 日本人はかなり消極的、に見える。
- スパム記事がめちゃくちゃ多い。邪魔。ホント害悪。 ココ (Qiitaの全記事一覧) を数日分さかのぼると分かります。海外から大量にスパム投稿されています。
4.Githubについて
- (1)斬新、(2)超便利、(3)論文の再現実装、(4)持続的なエンハンス、(5)ネームバリュー、このあたりの要素が強いリポジトリが「Star」数を大きく獲得している気がする。
- ターゲットが全世界。利用している人の母数がQiitaに比べておそらく圧倒的に多い。
- 純粋にコードの「意味」「利用価値」に対して評価が付く感覚。
- 「Star」数は技術力の評価指標とは成り得ず、単なる人気投票に過ぎない、という論評がある。
- 自身のリポジトリに対してissueを投稿してくるユーザは大抵の場合低レベル。あくまで私のリポジトリに対して、の話です。私のリポジトリ自体が低レベル、というバイアスが大きいかもしれません。
- リポジトリに対するissueの数が多い。技術的な提案や問題指摘が多い分、リポジトリに直接関係しない内容を「質問」してくる場違いな人も多い。
- 何故かメールを駆使して必死にコンタクトをとろうとしてくるユーザーが居る。 必死だからか、そういう方々は真摯な対応であることが多い。
- コミットしてからある程度の期間が経過したリポジトリでも、しっかり一定数のViewが獲得できる。
- Githubサイト内からの流入が圧倒的に多い。
- 歯が浮くような賞賛コメントが多い。
- 中国人がやたらとガツガツしている。欧米人も割と積極的。
- 性質上、スパム という概念が存在しない? というか、あったとしても探すほうが難しい?
- Githubのアクティブユーザーとフォロワー数の関係は当てにならない?
- 私はどうやら世界の上位0.2%のアクティブユーザーとしてランクインしたようです(笑) Why GitHub Won't Help You With Hiring を読むとカラクリと問題点が分かります。
5.QiitaとGithubの評価数に違いを生じさせそうだと考えた要素
- 日本人と海外の方々の感性の違い
- 見る人それぞれの文化の違い
- 日本と海外の価値観の違い
- QiitaとGithubの文化やそもそも使い方のスタンスの違い
- フォロワーが投稿者をフォローをする際の意味合いの違い
- リコメンド機能の有る無し、挙動の違いを含めた、システム全体のふるまいの違い
- インフルエンサーの影響力(いいね・Star、フォロー時の影響力)
- 目当ての言語・技術への検索操作による引き当てのし易さ
- 言語(英語 or 日本語)
- 投稿のタイミングと時差の関係(私のリポジトリにStarを付けるユーザーは中国人・台湾人が圧倒的に多い)
- サイトそのものに対する商売要素の有る無し
- 中身が空に等しい、空記事・空リポジトリの数 (git-awards.com を使用するとGithub上の世界ランクが算出されますが、私のリポジトリがやけに高ランクになることが分かります。おそらく空リポジトリが全体の90%前後を占めることが理由でしょう。ちなみに、Japanリージョンの40位以上は獲得Star数がインフレします。)
6.私の記事・リポジトリへの流入経路
私が投稿している内容が、DeepLearningの実装 や ロボット系、IoT に偏っているため、かなりのバイアスが掛かっています。
QiitaはGoogleアナリティクスで1年分を集計しました。
GithubはInsightsのTrafficから半年分を集計しました。
6−1. Qiitaへの流入経路
1位. Google検索
2位. Qiita
3位. Youtube
6−2. Githubへの流入経路
1位. Github検索
2位. 技術系Forum
3位. Qiita
7.私の記事・リポジトリへの流入国
こちらも、私が投稿している内容が、DeepLearningの実装 や ロボット系 に偏っているため、かなりのバイアスが掛かっています。
Githubは日本がランク外でした。
言語圏の影響が大きく反映されているようです。
7−1. Qiitaへの流入国
1位. 日本
2位. 中国
3位. アメリカ
7−2. Githubへの流入国
1位. 中国
2位. アメリカ
3位. 台湾
以下、ドイツ、フランス、オーストラリア。。。と続く。
8.私の記事・リポジトリへ評価が多く付くタイミング
私の在所が日本であることの影響が大きく反映されています。
各国のお昼休み前後に集中しているような気がします。
あくまで、私が投稿した記事のみでの感覚です。
8−1. Qiitaへの「いいね」
平日日中11時〜13時ごろ
8−2. Githubへの「Star」
日本時間11時ごろ、と、17時ごろ
日本時間深夜1時〜3時ごろ
X. まとめにもならない無茶苦茶なまとめ
はなはだ主観しかない内容です。責めないでください。
改めて書きますが、私は別に、Qiitaが良いとかGithubが良いとかそういうことを考えているのではありません。
実際に使ってやろう、カスタマイズしてやろう、使えそう、ゴミくずだ、儲けられそう、の評価がとてもハッキリしているのが Github。
話が面白い、技術的に面白い、日本語、の評価が高いのが Qiita。
たいした比較もしないまま終わろうとしています。
きっと、もっと比較すべき観点があるのでしょうね。
いやぁ、不毛ですね。
ダメだ、やっぱり腹落ちしない。
思いついたら少しずつ比較の指標を書き足していこうと思います。
本当はしっかりと数値をとって比較すべきです。
面白い、と少しでも感じられたデータサイエンスがお好きな方に分析していただけると嬉しいです。