TL;DR
AI時代におけるTypeScriptは、LLMとの協調開発において最適の言語です。
AIと組むならTypeScriptを積極採用しましょう!
はじめに
みなさんはTypeScriptについてどんな印象がありますか?
- JavaScriptのスーパーセット
- 流行っている
- 型安全でバグを防げる
- 大規模開発に適している
- etc
その印象で合っていますが、AIという文脈においては、認識を改める必要があります。
TypeScriptは今や、AI・LLMとの協調開発において構造的な優位性を持つ言語へと進化しています。
実際、2025年のGitHub OctoverseではTypeScriptがPythonを抜いて世界1位になりました。なぜこれほど急成長しているのでしょうか?
本記事では「なぜAI時代にTypeScriptが強いのか」を、以下の4つの観点から考察します。
- 学習データの「質」
- 型システムによるフィードバックループ
- 専用データセット(ManyTypes4TypeScript)
- LLM学習データにおける存在感(The Stack)
GitHub Octoverse 2025:TypeScriptが世界1位に
GitHub が毎年発表している Octoverse レポートによると、2025年8月時点でTypeScriptがGitHub上で最も使用される言語になりました。
Pythonを約42,000コントリビューター差で上回っています。
一部Octoverseのデータを抜粋します。
2025年 プログラミング言語ランキング
| 言語 | ランク | 前年比コントリビューター増加 | 前年比成長率 |
|---|---|---|---|
| TypeScript | #1 | 約105万人 | 66.63% |
| Python | #2 | 約85万人 | 48.78% |
| JavaScript | #3 | 約43万人 | 24.79% |
| Java | #4 | 約17万人 | 20.73% |
| C# | #5 | 約14万人 | 22.22% |
TypeScriptは前年比66.63%成長という驚異的な伸びを見せ、新規プロジェクト(green-field development)における優位性を示しています。
2023-2025年 ランキング推移
2023年2月時点ではTypeScriptは第3位でしたが、着実に順位を上げ、2025年8月には第1位に到達しました。
注目すべきは JavaScriptが第1位から第3位へと下降している 点です。
これは、従来JavaScriptで書かれていたコードがTypeScriptへ移行していることを示唆しています。
JavaScript + TypeScript の合計使用量
JavaScript と TypeScript を合算すると、450万人以上のユーザーを抱え、Pythonの約2倍の規模になります。
つまり、Web開発エコシステム全体で見ると、JS/TSは圧倒的なシェアを持っているのです。
なぜTypeScriptがこれほど成長したのか?
GitHub Octoverse では、TypeScriptの成長要因として以下を挙げています:
- デフォルトでTypeScriptを採用するフレームワークの増加(Next.js、Vite など)
- AIアシスト開発が、より厳格な型システムから恩恵を受けている
TypeScriptの台頭は、型付き言語への移行を示しており、エージェント支援コーディングをより信頼性の高いものにします。
つまり、TypeScriptの成長はAI開発ツールの普及と密接に関係しているのです。
理由1:学習データの「質」が高い
LLMは公開されているコードからパターンを学習します。ここで重要なのは「量」だけでなく「質」です。
TypeScript/JavaScriptの特徴
- 小規模で独立したスニペットが豊富
- React/Angular/Vue のコンポーネントは「1ファイル完結」が多い
- Stack Overflow や GitHub Gist に「そのまま動く」サンプルが大量にある
C++/Javaの特徴
- 大規模なエンタープライズコードベースに多く登場
- 公開スニペットが「より大きなコンテキストに依存した断片」になりがち
- 単体では動かないコードが多い
LLMにとって「小規模・独立・完結」したコードは、クリーンで転用可能なパターンとして学習しやすいのです。
理由2:型システムが「フィードバックループ」を作る
TypeScriptの最大の武器は、コンパイル時の型チェックです。
これがLLMとの開発で強力なフィードバックループを形成します。
┌─────────────────────────────────────────────┐
│ LLMがコード生成 │
│ ↓ │
│ TypeScriptコンパイラが型チェック │
│ ↓ │
│ エラーがあれば具体的・局所的なメッセージ │
│ ↓ │
│ LLMがエラーを修正 │
│ ↓ │
│ 再度型チェック...(繰り返し) │
└─────────────────────────────────────────────┘
TypeScriptでは、コンパイラが厳格なシニアエンジニアのように機能し、LLMからのすべての反復が型の一貫性について即座にチェックされます。
Pythonとの違い
Pythonにも型ヒント(Type Hints)がありますが、これはオプショナルです。
実行時に型チェックは行われません。
一方、TypeScriptの型は必須で普及しており、より強い学習シグナルを生み出します。
| 言語 | 型の強制力 | LLMへの効果 |
|---|---|---|
| TypeScript | 必須(コンパイル時チェック) | 強いフィードバック |
| Python | オプショナル(型ヒント) | 弱いフィードバック |
理由3:専用の大規模データセットが存在する
当然ですが、LLMがコードを生成する精度は、学習データの量と質に大きく依存します。
では、TypeScriptにはどれだけの学習リソースがあるのでしょうか?
実は、TypeScriptには型推論AIを訓練するための専用データセットManyTypes4TypeScriptが存在します。
これは、TypeScriptのコードから型を自動予測するAIモデルを訓練・評価するために作られた大規模なデータセットです。
以下の表は、ManyTypes4TypeScriptのデータと規模を表したものです。
| 項目 | 数値 |
|---|---|
| 型注釈の数 | 900万以上 |
| プロジェクト数 | 13,953 |
| ファイル数 | 約54万 |
この規模は Pythonの類似データセット(ManyTypes4Py)の約10倍であり、TypeScript向けとしては世界最大のデータセットです。
つまり、AIが「TypeScriptの型の付け方」を学ぶための教材が、他の言語より圧倒的に充実しているのです。
補足:シーケンスベース型推論とは
この論文で使われている「シーケンスベース型推論」という用語を簡単に説明します。
シーケンス、つまりコードを「トークン(単語)の並び」として扱うことです。
例えば以下のようなコードがあったとしましょう。
const name: string = "hello"
これを機械学習モデルは以下のように見ます。
["const", "name", ":", "string", "=", "\"hello\""]
つまり、シーケンスベース型推論とは、この「トークンの並び」を読んで、文脈から型を予測する手法のことです。
const name: ??? = "hello" // → stringと予測
const count: ??? = 42 // → numberと予測
ChatGPTが文章の続きを予測するのと同じ原理で、コードの「型」を予測するわけです。
このデータセットが大きいということは、TypeScriptの型予測においてAIが学習できる「お手本」が豊富にあることを意味します。
理由4:The Stack における学習データ量
The Stackは、LLM(大規模言語モデル)の学習に使われる、世界最大級のソースコードデータセットです。
簡単に言うと、「AIがプログラミングを学ぶための教科書」 のようなものです。
以下はThe Stackの概要と提供しているコードデータおよび、その規模を表にしたものです。
| 項目 | 内容 |
|---|---|
| 作成者 | BigCode プロジェクト(Hugging Face と ServiceNow の共同研究) |
| データ量 | 約 3TB(重複除去版) |
| 対応言語 | 358 のプログラミング言語 |
| ソース | GitHub の公開リポジトリ(permissive ライセンスのもの) |
ChatGPTやGitHub Copilotなどのコード生成AIは、このようなデータセットから「こういうコードを書くと動く」というパターンを学習しています。
The Stack における言語分布
CやJavaScriptのような広く採用されている言語は、JuliaやScalaのようなニッチな言語と比較して圧倒的に多く含まれています。
TypeScriptはpermissiveライセンス(MITなど)の比率こそ低い(約4%)ものの、絶対量が膨大なため、LLMの学習データとして十分な規模があります。
なぜ学習データ量が重要なのか
LLMは「見たことのあるパターン」を再現・応用するのが得意です。つまり:
- 学習データが多い言語 → AIが多くのパターンを知っている → 精度の高いコード生成
- 学習データが少ない言語 → AIの「引き出し」が少ない → 精度が低くなりがち
TypeScriptは利用者が多く、公開コードも豊富なため、AIにとって「よく知っている言語」なのです。
まとめ
AI時代にTypeScriptが強い理由を整理します。
| 観点 | TypeScriptの強み |
|---|---|
| 利用者数 | GitHub Octoverse 2025で世界1位(前年比66%成長) |
| 学習データの質 | 小規模・独立・完結したスニペットが豊富 |
| 型システム | コンパイル時チェックによる即時フィードバック |
| 専用データセット | ManyTypes4TypeScript(Python比10倍) |
| AIとの相性 | 型情報がLLMに豊富なコンテキストを提供 |
| LLM学習データ | The Stackで豊富なJS/TSコードが学習済み |
TypeScriptを選ぶことは、単に「流行っているから」ではありません。
AI・LLMとの協調開発において、構造的な優位性があるのです。
これからAI時代の開発スタックを考える際、TypeScriptは有力な選択肢になるでしょう。
参考文献
GitHub Octoverse 2025
TypeScriptとLLMの相性に関する記事
ManyTypes4TypeScript 論文
The Stack データセット
LLMとコード生成に関する資料

