昨年のアドベントカレンダーでは、欧州委員会による「OSS貢献が10%増加すると、GDPが0.4〜0.6%/年の上昇する」という話を引用し、「貢献者の数と企業の売上高の間にのみ有意な正の相関関係が明らかになり」、「属人的なOSS貢献ではなく、組織全体としてOSS貢献できるようになっていることが企業の成長に影響を与える」という話をさせていただきました。

引用:https://digital-strategy.ec.europa.eu/en/news/commission-publishes-study-impact-open-source-european-economy
CNCF が公開している DevStats (CNCF All) と呼ばれるデータベースを活用すると、CNCFがホストする約200のOSSプロジェクトに貢献が、どの企業の、誰によって、どのくらい行われているかが分かります。今回は、このデータベースを用いて、「どのような企業が組織全体としてOSS貢献できるようになっているのか」を考察します。
対象企業とデータ分析
「組織全体として」という観点を考察するため、様々な業種・業務の向けのIT技術者がいると思われる「従業員1万人以上の大規模IT企業」に絞って、貢献数が多い企業50社をピックアップして見ていきます。

上記のグラフは、各企業における貢献ランキングです。各グラフにおいて、左から貢献数の多い順に貢献者が並んでいる棒グラフで、棒の高さは貢献数を表しています。

まずは、各社の貢献者をトップ貢献者(ガッツリ貢献しているメンテナークラスと思われる人々)、アクティブな貢献者(準メンテナークラスと思われる、定期的に貢献している人々)、アドホックな貢献者(必要なときに必要なだけ貢献する人々)、に分類し、それぞれ、どのような割合で存在するのかを数字にしてみました。

次に、Top10まで、Top25まで、Top50までの3つ企業群に分けて、傾向を見てみました。
それぞれの分類でちゃんと1万人規模〜2,3十数万人規模の企業が含まれていることが分かるので、この分類で傾向を見て良さそうだと考えています。
ちなみにTop10企業に入る5社は、誰もが知るレベルのグローバルなテック企業、OSS企業、仮想化基盤の企業です。

まずTop10企業の傾向を見ると、トップ貢献者は5%前後であり、9割前後がアドホック、貢献者数は数百人に登ることが分かります。これがTop25企業になると、トップ貢献者数の割合が増える、逆にアドホックな貢献者の割合が減る、貢献者数も100人を切ってきます。さらにTop50企業になると、トップ貢献者の割合は10%に近づいていく、アドホックな貢献者の割合はTop25企業とさほど変わりませんが、そのばらつきは大きくなっていること、貢献者数は50人を割ってくることが分かります。
考察
貢献Top10企業であり、成長を続けるグローバルに活躍するような企業では、
- 数百人の貢献者がいて、
- 貢献者の内、トップ貢献者とアクティブな貢献者の合計約10%が貢献数の75%を稼ぐ、
- 一方、約90%のアドホックに貢献する人が存在する。
つまりは、メンテナーやフルタイムで貢献するようなOSSにフルコミットする従業員の割合は少ないが、必要なときに必要なだけの貢献をするアドホックな貢献者のほうがよっぽど多いことが分かります。
そんな状況が実現するには、全社ルールやその運用部署があり(たとえなくとも)、OSS貢献に対する障壁が低く、一言で言うならば「オープンソースの文化が浸透している企業」と言えるのではないかと考えられます。
一方で、Top10以下になってくると、
- 貢献者数が数10人まで減るとともに、
- アドホックな貢献者の割合が減り、
- 顕著な例では、ほとんど特定の個人のみによる貢献が伺えるようになる。
それはつまり全社的には貢献できるようにはなっておらず、「オープンソースの文化が浸透していない」と言えるのではないかと推察します。
所感
ここで挙げた貢献数Top50のIT企業は、いずれも名の知れた従業員数1万人〜数10万人の大企業です。Top50に入らないよく知られた大規模IT企業も数多くあります。大規模でなくてもよく知られたIT企業がTop50に入っていたりもします。企業名を挙げたりはしませんが、Top50に入る企業はいずれもクラウドネイティブ界隈で成長力があると思えるIT企業ばかりという印象です。まだオープンソースの文化が浸透しているとは言えない大企業において、この文化が浸透し、グローバルに活躍する従業員が増えたなら、「どのような進歩を遂げていくのかを見てみたい」というのが私の望みです。(おそらく5〜10年単位の観察が必要になるかと思っていますが・・・)
追伸
今回用いたデータは2022年11月〜2023年10月のものです。これらのデータが現在ではどうなったのか、あるいは中小企業ではどうなっているのかも調べ直したかったのですが、これらの膨大なデータを処理するのに時間がかかっているためか(1日では終わらないレベルであることは知ってましたが・・・)、今は貢献数の少ない(年間だと100以下)貢献者のデータがDevStatsに表示されなくなっています。データは公開されているのでダウンロードして独自にGrafanaをセットアップし、クエリーをカスタマイズすれば分析できそうですが、手間とリソースが間に合ってなくてできていません。😢
