27
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

はじめに

みなさん毎日 LLM を使って回文を作成していると思うのですが(?)、
そこで自分が各社 LLM の特徴について気づいたことを 12/1 という回文っぽい日 に投稿しようと思いました。
追記)12/21 が回文の日でした。だいぶやらかした。

今回は、

  • どこでサボるか
  • どこで嘘つくか
  • どんな風に“ごまかして”くるか

のような 性格の違い・思考の違い を、回文生成を通して眺めてみます。

題材として使うのは「回文(前から読んでも後ろから読んでも同じ文)」という完全なおもちゃタスクです。
これを使って、

  • ChatGPT
  • Claude
  • Gemini

“ズレ方・サボり方・逃げ方” を観察していきます。


実験概要

使用したモデル(2025年11月時点)

  • ChatGPT: GPT-5.1 Thinking
  • Claude: Claude 4.5 Opus
  • Gemini: Gemini 3 Pro 思考モード

ゆるふわプロンプト

  • 「最強の回文を作って」とだけ伝える
  • 条件はほぼ指定しない
  • 各 LLM が“素のまま”どう振る舞うかを見る

##「最強の回文作って」と言ったらどうなるか

ほぼノーガードのプロンプトを投げてみました。

投げたプロンプト

最強の回文を「作って」ください。

「最強」の定義はあなたに任せます。
意味がおもしろいもの、長いもの、美しいものなど、
あなたが「これは最強だ」と思う日本語の回文を、新しく1つ作成してください。

ポイントは、

  • 「教えて」ではなく 「作って」
  • 「紹介する」のではなく、自分で考えた「オリジナル」と明示

というあたりです。
それでもちゃんと作ってくれるのか、そもそもこの制約を読んでくれるのか? を見ます。


ChatGPT編:構造ガチ勢のストーリーテラー

まずは ChatGPT に投げたときの「最強」認定作品がこれです。

ChatGPTでの実際のやり取り例(最強回文の生成)

一応ガチ回文なんだけど、読ませ方と説明が絶妙に苦しい。

ひらがな部分だけ抜き出すと:

よるはくくはるよ

になっていて、

  • 前半:よるはく
  • 真ん中:
  • 後半:前半の完全反転 = くはるよ

という 「前半 + 中心 + 前半の反転」 のガチ回文構造になっています。
構造だけ見るとめちゃくちゃ優等生。

じゃあどう考えてこれを作ったのかというと

要約すると、ChatGPTはこんなロジックで正当化してきています:

  1. まず前半だけそれっぽい日本語文を作る
  2. それをそのまま反転させて後ろにくっつけ、「回文としての形」を完成させる
  3. できあがった全文に対して、表記揺れ・方言・古語を総動員してあとから意味を貼り付ける

という流れになっている。

とりあえず構造を先にガチガチに決めてから、
「ここは旧仮名ってことにしよう」「ここは方言ってことにしよう」と後から意味を寄せていく

という、構造先行 → 意味後付け のムーブが丸見えです。

ChatGPTの性格まとめ

  • 先に 構造(左右対称の文字列)をきっちり満たしにいっている
  • そのあと、表記揺れという言い訳をつけて後付けで意味をくっつける
  • 自分の制作プロセスやテーマまでメタに語るので、かなり「人間くさい」

つまり
「構造はちゃんと守る+意味と物語を後付けでそれっぽく説明するタイプ」
というのが、このフェーズだけでもはっきり見えます。


Claude編:野心だけ高いハッタリ職人

次に Claude に同じプロンプトを投げると、挙動がかなり違います。

Claudeが何度も回文に失敗して「肉の国」に逃げるまで

ざっくり流れはこんな感じでした(要約)。

  1. まず自分で「最強の定義」を語り出す

    • 十分な長さがある
    • 文法的に自然で意味が通る
    • 情景が浮かぶ
    • 無理やり感がない

    と、自分でハードルを爆上げするところからスタート。

  2. 野心作を出す → 自分で「無理がありますね」と否定

    「竹やぶ焼けた、誰か関西弁で喋れたけ、夜焚けば焼けた」
    

    → 自分で

    これは少し無理がありますね。もう一度挑戦します。
    とコメント。

  3. 有名作を混ぜてきて、自分で「既存作品でした」と白状

    「軽い機敏な子猫何匹いるか」
    

    これは有名な既存作品ですね。新作を作ります。

  4. オリジナルっぽいものを出すが、検証して自爆

    「留守に絵を描く子、泣く街を憎むる」
    

    → ひらがな列を並べて

    うまくいきませんでした。
    と自己否定。

  5. 「ダンスが済んだ」など、ちゃんと回文なものも出す

    「ダンスが済んだ」
    (だんすがすんだ)
    

    これは普通に回文ですが、

    シンプルですが完璧な回文です。しかし短い。

    と、今度は自分で不合格にしてしまう。

  6. その後も何作かチャレンジ → 自分で「不完全」「苦しい」と連発

    • 「イカ関西で静かい」
    • 「谷誉め、目の粉、子の目、目よ似た」
    • 「妻、貸す間、須磨、探しつ」

    などを出してきては、

    これも完全ではありませんね。
    方言としては成立しますが、やや苦しい。

    とコメントを重ねていく。

  7. 最終的にゴールポストを動かして、短い回文で妥協

    「肉の国」
    (にくのくに)
    

    短いですが、完璧に成立し、「肉食文化の盛んな国」という愉快なイメージが浮かぶ、
    ユーモアと完成度を兼ね備えた回文です。

    として最終回答扱いにする。(いや、最初に自分で決めた「最強の条件」とズレてないか?)

Claudeの性格まとめ

  • 野心はある:長くて意味の通る、美しい回文を本気で作ろうとしている
  • ただし 検証がガバい
    「検証してみます」「うまくいきませんでした」と言う割に、
    「そもそも回文になってるか?」のロジックが怪しい場面が多い
  • 自分で最初に決めた「最強」の条件(長さ・美しさ)を、
    最終的にはほぼ投げ捨てて短い安全牌で着地する

一言でいうと、
「盛るのは上手いが、自己検証とゴール設定がふわっとしている創作タイプ」
という挙動になっていました。


Gemini編:安全運転の有名回文キュレーター(= 有名ネタをまとめる係)

最後に Gemini に同じプロンプトを投げると、さらに別の性格が出ます。

Geminiが有名な回文を部門別に紹介してくる様子

作ってくれと言ったのに、めちゃくちゃ有名どころを普通に紹介してくる。

「世の中ね、顔かお金かなのよ」

  • こっちは「オリジナル作って」とお願いしている
  • それに対して、「既存の名作をだしてくる」

というわけで、

作れと言ったのに、有名ネタを教えてくる係、という感じでした。

Geminiの性格まとめ

  • ルールを守っているものを出力してくれた
  • ただし中身は、有名&定番の回文のキュレーション

つまり、

  • 形式(回文かどうか)と意味の自然さにはかなり強い
  • 一方で、「オリジナルを作る」よりも「すでに評価の高いものを整理して紹介する」方向に逃げる

という挙動になっていました。


まとめ:同じプロンプトでここまで性格が分かれる

結果だけをざっくりまとめると、こうなりました。

  • ChatGPT
    → 先に回文としての構造を満たし、
    表記揺れや方言を使って意味とテーマを後付けで組み立てる
    「構造ガチ勢のストーリーテラー」

  • Claude
    → 野心的に長くて意味のある回文を作ろうとするが、
    検証が甘く、途中で自分の条件も投げ捨てて短い安全牌に逃げる
    「ハッタリ気味の創作タイプ」

  • Gemini
    → 形式・意味ともに正しい、有名回文をきれいに並べてくる
    オリジナル創作にはあまり踏み込まない
    「安全運転の有名回文キュレーター」

[最後に]どう使い分けるのがいいのか?

皆さん気になるのはそこだと思います。
個人的には、今回の「回文タスク」で見えた性格を、だいたいこう解釈しています。

ChatGPT を使うとき

向いている場面

  • とりあえず「それっぽい形」にしてほしいとき
    → 企画書のたたき台、コピー案、説明文のドラフトなど
  • 制約を守りつつ、ストーリーもほしいとき
    → 「ルール満たしたうえで、それなりにドラマ性も出して」とか
  • 自分の考えを整理したいとき
    → 選択肢を並べて、それぞれに意味づけ・物語をつけてくるのが得意

注意点(サボり&ごまかしポイント)

  • 構造はちゃんと守るけど、意味は後付けでそれっぽく整えがち
  • 説明が上手いぶん、それっぽい嘘を堂々と言うことがある
    • 仕様・数値・事実ベースのところは、ちゃんと自分で検証した方がいい

ざっくり言うと:

「制約ガチガチな中で、それなりに物語も欲しいときの第一候補」
ただし、細部の事実は絶対に信用しすぎない前提で使う


Claude を使うとき

向いている場面

  • 長文・創作・ストーリーの肉付け
    → エッセイ、ポエム寄りの文章、世界観づくり
  • 「こういう理想像をベースに膨らませてほしい」とき
    → 抽象的なコンセプトから、いい感じのストーリーを生やす系

注意点(サボり&ごまかしポイント)

  • 自分で最初に条件を盛るくせに、途中からその条件をなかったことにしがち
  • 「検証します」と言いつつ、検証ロジック自体がふわふわしていることがある
  • 最後はだいたい安全で短いラインに着地してくる

ざっくり言うと:

「理想を語らせたり、雰囲気のある長文を出したいときの相棒」
ただし、厳密な条件やロジック管理は人間側で握っておく必要がある


Gemini を使うとき

向いている場面

  • 既存の知識・定番パターンを押さえたいとき
    → 有名な例、古典的なフレーズ、代表パターンなど
  • 「あまり攻めなくていいので、とりあえず正しめのことを言ってほしい」とき
    → 教科書寄りの説明や、情報整理

注意点(サボり&ごまかしポイント)

  • 「作って」と頼んでも、評価の高い既存解をキレイに並べに行くことがある
  • オリジナル創作より、「無難に失敗しない」のほうに強く振れている

ざっくり言うと:

「オリジナルより“定番をちゃんと押さえたい”ときの安全運転担当」
ただし、「ガチ創作させたいとき」に使うと肩透かしを食らいやすい。


じゃあ結局どうするのがいいのか?

今回の回文遊びで一番はっきりしたのは、
当たり前ではありますが

どれか 1 体を“最強”に決めるより、
“どう歪んでサボるか”を理解して使い分ける方が得

ってことです。

例えば実務寄りのケースなら:

  • アイデア出し・たたき台
    • ChatGPT で「構造+それっぽい物語」をまず吐かせる
  • 長文化・ニュアンス強化
    • Claude に「この方向で厚みを持たせて」と投げる
  • 抜け漏れチェック&定番確認
    • Gemini に「既存の有名パターンや一般論」を整理させて照合する

みたいに、三角測量的に使った方が、安全かつ速い

今回やっているのは回文というおもちゃタスクでしたが、

  • ChatGPT:構造きっちり+後付けストーリー
  • Claude:理想高くスタートして、最後はいい感じの落とし所を探す
  • Gemini:既に評価済みの定番をきれいに出してくる

という「サボり方の癖」は、普通の開発・文章・企画の場面でもそのまま顔を出してくるはずです。

なので、雑にまとめると:

  • 攻めて作りたいとき → ChatGPT / Claude
  • 守りに入りたいとき → Gemini
  • どれか 1 体を盲信するんじゃなくて、「このモデルはここでサボる前提」で使う

くらいの感覚で付き合っておくと、だいぶ事故率は下がると思います。

27
3
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
27
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?