こんにちは、座禅いぬです。
この記事はマナビDX Quest で得たもの Advent Calendar 2025 シーズン2の4日目の記事です。
僕は「AIに文章を生成させて記事量産で不労所得!」みたいなのは興味がないんです。でも、「自分をAIで複製したい」という夢はある。自分の考え方、自分の言い回し、自分のリズムで文章を書くAI。それが作れたら面白いなと思っています。
そんな中、AIの情報発信をされている方が「文体を模倣させる」という話題を出されていて、興味を持ちました。自分でもやってみようと思い立ったのが今回の実験です。
課題:AIは「僕らしい文体」をまだうまくつかめていない
AIに文章を書かせるとき、「カジュアルに書いて」と指示してもなんか違う。「僕の文体で」と言っても知らんがなという話ですし、「過去記事を参考に」と言っても、どれを?どこを?となってしまいます。結局、何度も修正指示を出して、最終的には自分で書き直す羽目になる。このパターン、何度も繰り返してきました。
問題の本質は、「僕の文体」が言語化されていないことだと気づきました。「なんとなくこう書いてる」という感覚はあっても、それをAIに伝える手段がない。だから毎回「違う」「もっとこう」と後出しで修正することになる。これは非効率だし、AIの能力を活かせていません。
解決策:文体ルールブックを作る
そこで考えたのが、過去記事を統計的に分析してルール化するアプローチです。手順は以下の通りです。
- 過去記事を大量に分析する
- パターンを統計的に抽出する
- ルールとして言語化する
- Claude Codeに参照させる
ポイントは**「統計的に」**というところです。「なんとなくこう書いてる気がする」じゃなくて、「30記事中28記事でこのパターンを使っている(93%)」という数字で裏付ける。これがないと、たまたま1記事だけで使った表現を「必須ルール」と勘違いしてしまいます。
Deep Researchで30記事分析
自分で30記事読んで分析するのはしんどい。そこでDeep Researchの出番です。僕はChatGPTのDeep Researchに、冒頭の書き出しパターン、タイトル命名パターン、文体・表現の特徴、記事構成パターンなどを調査依頼しました。約30分後、詳細な分析レポートが返ってきました。
調査項目は以下のように構造化しています。冒頭パターンは「どう始まるか」、タイトルは「どう名付けるか」、文体は「どう表現するか」、構成は「どう組み立てるか」という4つの観点で分析を依頼しました。
## 1. 冒頭の書き出しパターン
- 全記事の冒頭文を抽出
- パターン分類と頻度
## 2. タイトル命名パターン
- 全記事のタイトル一覧
- パターン分類と頻度
- 平均文字数
## 3. 文体・表現の特徴
- 一人称の使用(僕/私/自分)
- 口語表現の種類と頻度
- 絵文字の使用頻度
## 4. 記事構成パターン
- 見出しの平均数
- 「まとめ」セクションの有無
このように調査項目を明確にしておくと、Deep Researchが構造化された分析結果を返してくれます。曖昧な依頼だと曖昧な結果になるので、「何を知りたいか」を具体的に書くのがコツです。
分析結果:数字で見える「僕の文体」
-
冒頭の書き出し: 93%が「こんにちは、座禅いぬです。」という挨拶から始まっていました。これは必須ルール確定です。逆に言えば、7%は挨拶なしで始めることもある。この「例外もある」という情報も重要です。
-
タイトル命名: 問題解決・ハウツー型が40%超で最多、平均文字数は約23.6文字でした。「〜ぜ」形は10%しか使っていなかったので、使いすぎると「座禅いぬっぽさ」が薄れるかもしれません。この記事のタイトルも「〜ぜ」形ですが、これは10%の中に入る選択ということになります。
-
文体の特徴: 一人称は「僕」多用で「私」は一度も使っていませんでした。無意識にやってたことが数字で見えると面白いですね。口語表現も思ったより控えめで、「〜ですよね」「〜なんです」といった柔らかい語尾が中心。絵文字はほぼ不使用でした。
ルールブック作成
分析結果を基に、ルールを「必須/推奨/オプション/禁止」の4段階で整理しました。全部「必須」にすると柔軟性がなくなるし、全部「推奨」だと何を守ればいいかわからなくなります。頻度データに基づいて優先度を決めるのがポイントです。
以下が実際に作成したルールブックの抜粋です。80%以上の頻度で使っているパターンを「必須」、観測されないパターンを「禁止」としています。
## ルール優先度
| 優先度 | 定義 | 頻度 |
|--------|------|------|
| 必須 | 常に適用 | 80%以上 |
| 推奨 | 基本的に適用 | 50-80% |
| オプション | 状況に応じて | 50%未満 |
| 禁止 | 使用しない | 観測されない |
## 必須ルール
- 冒頭:「こんにちは、座禅いぬです。」
- 一人称:「僕」(「私」禁止)
- 絵文字:使わない
- まとめセクション:技術記事は必須
## 禁止ルール
- 「私」の使用
- 絵文字の乱用
- 過度に堅い文体
このルールブックをClaude Codeが参照できる場所に置いておけば、記事作成時に自動的に読み込んで僕の文体で書いてくれるようになります。
Claude Codeへの組み込み
作成したルールブックをCLAUDE.mdに参照させます。CLAUDE.mdはClaude Codeがプロジェクト全体で参照する設定ファイルで、ここに書いた指示は常に適用されます。「Qiita記事を書いて」と指示したらルールブックを参照する、というトリガーを設定しておけば、記事を書くよう指示すると自動的にルールブックを読み込んで、僕の文体に近い形で書いてくれるようになりそうです。
さらに重要だと感じたのは、ルールブックだけでなく実際の過去記事も読ませることです。ルールは抽象化された情報なので、どうしても解釈のズレが生じます。実際の記事を読むことで、段落の長さ、表現のリズム、口語の頻度などを「体感」できるのではないかと考えています。
結果:この記事自体がテスト
実はこの記事自体が、ルールブックと過去記事3本を読んでから生成したものです。読んだのは「人類はもう生成AIに勝てないと痛感したDeep Researchの使い方」「かけ算人材になろう」「マルチペルソナシミュレータで不安を減らそう」の3本。これらを読んでから書き始めることで、ルールブックの文字列ではなく、実際の記事のリズムを参考にできます。
重要な事実として、この記事は人間による直接的な文章の手直しを一切行っていません。フィードバックは「段落が細かすぎる」「口語表現が多すぎる」といったルールレベルの指摘のみで、文章そのものは全てClaude Codeが書いています。ルール整備にはまだ試行錯誤が必要ですが、ルールを改善すれば人間が手を入れなくても精度を上げていけそうです。
なお、参照した過去記事(僕の他のQiita記事)は、特別な記載がない限りすべて人間である僕自身が書いたものです。生成AIが書いた文章を学習しても「僕の文体」にはならないので、この点は重要です。ルールブックの精度は、人間が書いた過去記事の質と量に依存します。今後についても、明示的に記載していない限り生成AIで記事を書くつもりはありません。この記事はあくまで実験であり、普段の記事は引き続き自分で書いていきます。
まとめ
AIに自分の文体で書かせるには、「自分らしさ」を言語化する必要がありそうです。過去記事を統計的に分析し、パターンを数字で把握し、ルールを優先度付きで整理する。そしてルールブックだけでなく実際の過去記事も読ませて、フィードバックでルールを改善していく。この繰り返しで、AIは僕の分身に近づいていけるのではないかと考えています。
今回のアプローチは、記事作成だけでなく、LTや勉強会のスライド作成、メール文面やドキュメント作成など、「自分らしい文章」を求められる場面にも応用できるかもしれません。マナビDXクエストで勉強会を開催するようになって、資料作成の機会が増えました。そういった場面でも、自分の言葉で伝えることは大事だと思っています。
Deep Researchで分析し、ルールブック化し、Claude Codeに参照させる。まだ試行錯誤の段階ですが、僕と同じように「なんか違う」と感じている方の参考になれば幸いです。