はじめに
突然だが、筆者はかつてPSO2NGS向けのシンボルアートをパースするライブラリ「symbol-art-parser」を開発した。このライブラリのターゲットユーザーは、「PSO2NGSをプレイしながらシンボルアートを使ったWebサービスを作りたい」という、極めて限定的かつ奇特な人々に限られる。ビジネス価値は、控えめに言ってゼロである。
そこで先月、このライブラリの技術仕様書をQiitaに投稿した。ただし、目的は人間に読ませることではなく、LaprasのAIにどんな評価をさせるかという一種の性能試験である。
結果は・・・
実用性:4(超優秀)
見事に引っかかった。
Lapras AIが盛大にやらかした事例集
評価内容の詳細を読んでみると、一貫性のなさが光り輝いている。以下に代表的なものを紹介する。
1. 自己矛盾
論理性の評価:
「JSON Schemaの説明が本体から分離されており、TypeScript型定義との関連性が明確でありません。」
実用性の評価:
「JSON Schemaの説明も実用的で、VSCodeでの補完機能の活用方法が理解できます。」
同じJSON Schemaの記述について、片方では「関連性が不明確」と言い、もう片方では「実用的でわかりやすい」と称賛している。これを人間がやれば多重人格を疑われるレベルである。
2. 文脈の無視(その一)
「ゲーム文化的な脚注が多く…」
記事のタイトルにも冒頭にも「PSO2NGSのシンボルアートを解析するライブラリ」と明記している。ゲームの話が出てくることに驚くのは、餃子の皮の中に餃子の具が入っていることに驚くようなものだ。
3. 設計原則への無理解
「カプセル化を選んだのか、ArrayBufferを選んだ理由」
ライブラリ設計の基本原則として、ファイルの入出力の責務をライブラリ本体に持たせないというものがある。ArrayBufferを受け取る形にしているのは、Node.jsにおいても、ブラウザにおいても、動作させるための意図的な設計判断である。評価AIはここを疑問点として挙げているが、疑問を持つべきはAIの側ではなく…いや、やめておこう。
4. 文脈の無視(その二)
「技術仕様書としての明確性は高いですが、ゲーム文化的な背景説明が多く含まれており…」
ゲームのライブラリだと、何度言えばわかるのだろうか。
まとめ
今回の実験から導かれる結論は明確だ。
AIは即物的なシステムである。
どれだけニッチで実用性ゼロな内容でも、Markdownの構造が整い、JSON Schemaや型定義が添えられ、仕様書らしい体裁を纏っていれば、AIは「技術評価4:超優秀」を授けてくれる。入力された記号に反応しているだけであり、その背景にある文脈や意図は関知しない。今回の実験から得られた有益な知見ではある。
ただし、これはAIに限った話ではない。体裁だけを読んで判断する、文脈を無視して反応する——そうした振る舞いは、ほとんどの場面で人間にも見られる。AIはその傾向を可視化しやすいだけで、本質的な問題は使う側の解像度にある。
結局のところ、AIとは高度な知識を持った外部脳のようなものだ。何を入力し、出力をどう解釈するかは、完全に人間側に委ねられている。「設計図を読んだからといって、同じものが作れるとは限らない」のと同じように、AIを使えば何かが理解できるわけでも、正しく評価できるわけでもない。
後日談
本記事の公開前に、筆者は前フリとしてXに「記事でハッキングする」と投稿した。意図は言うまでもなく、「記事を使ってAIのスコアリングを検証する」という本記事の趣旨を指したものである。結果、即座に警告を受け、少なくとも8時間のアカウント停止となった。
続いてこの件をGeminiに相談したところ、複数のチャットセッションが程なくして機能停止した。
なぜか?「ハッキング」という単語が含まれていたためである。それ以外の理由はない。
筆者はちょうど1ヶ月前、別の記事でBeRealのインシデントを引き合いに、こう主張した。ルールは「What(何で)」ではなく「Why(なぜ)」で設計すべきだ、と。
今回、XやGeminiも、「ハッキング」という単語に機械的にヒットして反応した。文脈——すなわち 「Why」——は参照されていない。
自分が批判した問題を、自分が批判した直後に、自分が受けた。
『コードギアス』でルルーシュが、意図せずギアスを発動させて悲劇を招いたエピソードがあるが、今の心境はそれに近い。
記録として残しておく。
AIに人間の仕事が置換されるまで、少なくとも、年単位の時間がかかりそうである。