コード行数・PR数...それ、AIと"うまくやれてる"指標ですか？別のものさしを考えてみた

Last updated at 2026-03-28Posted at 2026-03-24

まず結論から

こういうものを作りました。

私の結果は The Explorer（開拓者） AI の新しい使い方を切り拓くタイプ、だそうです。
Breadth（応用力）が突出していて、Precision（指示精度）に伸びしろがあるらしい。

詳しい能力シートはこちら: profile.ja.md

GitHub プロフィール: https://github.com/suruseas

この記事では、なぜこれを作ったのか、どういう思想で設計したのかを書きます。

リポジトリ: https://github.com/suruseas/ai-fluency

English version available on dev.to.

「僕が一番、◯ンダムをうまく使えるんだ」

AI コーディングツールを日常的に使い込んでいる人なら、心のどこかでこう思ったことがあるんじゃないでしょうか。

某ガ◯ダムの主人公が叫んだあの台詞のように、自分と AI の相性のよさ、噛み合っている感覚、他の人よりうまくやれている手応え、、、それを感じている人は少なくないはずです。

でも、それを伝える手段がなくないですか？？

ダッシュボードで見る数値でわかるのでは？？？って違う、そうじゃない。って思いませんか？数字には表れない、あの「うまく噛み合ってる」感覚は。このモヤモヤをなんとか形にできないかな？と考えたのがそもそもの始まりです。

そしてもうひとつ。以前書いた記事 "I Deleted 66% of My AI Coding Guide — Here's What Survived" で、こんな問いを投げました。

あなたのチームは AI コーディングの生産性をこんな指標で測っていませんか？

よくある指標	何を測ってしまっているか
生成コード行数	量の目標は量を促進する。冗長なコードが「高生産性」になる
プロンプト回数	やりとりが多い＝指示がうまくいっていない可能性もある
レスポンス速度	考えてから指示する人を不利にする
コミット数	分割すればいくらでも膨らむ
導入ツール数	使うことと使いこなすことは違う

Lines-of-code targets reward bloat. Prompt-count targets punish thinking.
（コード行数を追えば無駄に膨らむし、プロンプト数を追えば「考えてから聞く人」が損をする）

どれも「量」を測っている。でも AI と「うまくやれている」かどうかは、量だけでは見えてこないよなぁ、という漠然とした違和感がありました。

その記事で書いた3つの永続的原則——可逆性を保つ・意図を明確にする・出力を検証する。AI Fluency はこれらを構造化された自己振り返りの形にする試み——スコアで順位をつけるのではなく、自分の協働スタイルを映す鏡のようなものです。

「Fluency（流暢さ）」という考え方

プロジェクト名を考えたときに一番しっくりしたのが英語の fluency の「流暢さ」。例えば英語のネイティブのように滑らかに話せる状態を指します。

AI との協働にも似たような感覚があると思っています。うまくいっているときは、指示と結果がスムーズに噛み合って、自然な流れで成果物ができあがっていく。逆にうまくいかないときは、何度も手戻りが起きて、お互いにもどかしい。

この「流暢さ」= AI と自然に協働できている度合い を可視化できないかと考えたのが出発点です。

別の物差し（5つの評価軸）

AIと対話を繰り返してこの流暢さを分解してみると、5つの力に行き着きました（というか対話結果として腑に落ちました）

軸	ひとことで言うと
Context Design（文脈設計力）	AI が迷わず動ける「場」を整える力
Precision（指示精度）	少ないやりとりで的確に伝える力
Steering（修正力）	AI の出力を見て、正しい方向に導く力
Output（遂行力）	AI と組んで、実際に成果を出す力
Breadth（応用力）	AI の引き出しを幅広く使いこなす力

最初の3つは、前述の記事の3原則に対応しています。

「意図を明確にする」→ Context Design（文脈設計力） + Precision（指示精度）
「出力を検証する」→ Steering（修正力）

残りの2つはさらに踏み込んで、協働が実際に成果を生んでいるか（Output）、単一パターンに閉じていないか（Breadth）を問います。

「プロンプト数が少ないこと」ではなく「少ないやりとりで的確に動かせているか」。「コミット数」ではなく「実際に達成できているか」。量から質への転換がこの設計の核です。

方法論について

この5軸は文献レビューや学術研究から導いたものではありません。AI との対話を繰り返しながら、「いい協働とは何か」を自分のセッションで分解し、カテゴリが重複しなくなるまで磨いたものです。科学的な計測器ではなく、意見のこもったフレームワーク。自己振り返りツールとしては、それでいいと思っています。

16のスタイル類型 -「点数」ではなく「個性」

5軸のスコアを出してみたのですが、「数字だけだと自分の特徴を人に伝えにくいな」と。「Context Design が76で Breadth が96で……」と言われてもピンとこないなーと思い、なんとなくのノリで「レーダーチャートの形からタイプを判定したら面白いかも？」と試してみたら、これがけっこうわかりやすかったので採用しました。

5軸のレーダーチャートの「形」から、16種類のスタイルが判定されます。スコアの高さではなく、どの軸が突出しているかで決まるのがポイント。優劣ではなく、AI との付き合い方の「個性」です。いくつか紹介すると：

The Sniper（狙撃手）（Precision）— 一撃必殺。最小の指示で最大の成果を引き出す
The Architect（設計者）（Context Design）— 環境設計の達人。AI が働きやすい基盤を作る
The Explorer（開拓者）（Breadth）— AI の新しい使い方を切り拓く。MCP やプラグインもいち早く実戦投入
The Surgeon（外科医）（Precision + Steering）— 精密な指示と繊細な修正で難題を解く
The Virtuoso（万能家）（バランス型）— 全方位型。あらゆる面で高水準

全16タイプ（バランス1 + 一軸突出5 + 二軸突出10）の一覧はリポジトリの README で見られます。

「コード行数が多い人が偉い」と同じ罠に陥らないように、あえてこういう設計にしています。全軸が高ければ偉いのではなく、それぞれの形に意味があります。

正直な制約

これは自己振り返りツールであって、人事評価ツールではありません。

スコアは実行ごとに変わる: 定性評価に LLM を使うため、結果は毎回少し異なります。AI ベースの評価を使うトレードオフとして、絶対値ではなくレーダーチャートの「形」を重視する設計にしています
スタイルは個人のもので、比較には向かない: 共通のルーブリックはありますが、あなたの「72」と他の人の「72」は同じ意味ではありません。形が大事です

もうひとつ正直に言うと、LLM を使って LLM との協働を評価するという循環があります。たとえば、簡潔だが的確なセッションより冗長なセッションを高く評価してしまうバイアスがあるかもしれません。まだ解決策はありませんが、スコアリングロジックがすべてリポジトリで公開されている透明性が助けになると思っています。

使い方

現時点では Claude Code だけでしか使えず、またClaude Codeのセッション分析データ(/insightsの出力結果)を参考にすることで対応しています（５つの評価軸自体はClaudeCodeに限らないエージェント共通の設計です）。

# 1. クローン & セットアップ
git clone https://github.com/suruseas/ai-fluency.git
cd ai-fluency
npm install

# 2. Claude Code で分析データを生成
claude> /insights

# 3. スコアカードを生成（日本語出力）
npm run score           # → output/scores.json
npm run card:ja         # → output/card-dark.ja.svg, card-light.ja.svg
npm run profile:ja      # → output/profile.ja.md

Claude Code 上で実行するなら /ai-fluency と入力するだけでもOKです（言語選択を聞かれるので「日本語」を選んでください）。

これで output/ に SVG カード（ダーク/ライト）と能力シート（Markdown）が生成されます。

GitHub の README に貼るなら以下のように貼り付けてみて下さい！

<a href="https://github.com/<username>/ai-fluency/blob/main/output/profile.ja.md">
<picture>
  <source media="(prefers-color-scheme: dark)" srcset="https://raw.githubusercontent.com/<username>/ai-fluency/main/output/card-dark.ja.svg">
  <img src="https://raw.githubusercontent.com/<username>/ai-fluency/main/output/card-light.ja.svg" alt="AI Fluency">
</picture>
</a>

おわりに

AI コーディングの生産性を「行数」や「プロンプト数」で測ろうとする風潮に対して、別のものさしを提案したかった。それがこのツールの出発点です。

測るべきは「量」ではなく、文脈を設計する力、的確に指示する力、軌道修正する力、成果を出す力、幅広く活用する力 つまり AI との協働の「質」、fluency です。

完璧な評価ツールではありませんが、「自分は AI とどう付き合っているんだろう？」を振り返るきっかけになれば嬉しいです。

Claude Code を使っていれば2分で結果が出ます。あなたは何タイプでしたか？

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up