はじめに
こんにちは。個人事業主でEMやIT相談のお手伝いをしている河崎です。
エンジニアとして日々忙しく働いていると、「アウトプットを習慣化したい」と思います。
でも、なかなか時間が取れずにブログ記事などを書けていない方も多いのではないでしょうか。
そんな中で、最近注目されている「Vibe Coding」にヒントを得て、音声を使って記事や情報を書き出す方法があるのではないかと考えました。
実は、この記事も大半を音声から書き起こしており、今回は、その具体的な方法についてまとめました。
この記事を読んで、一人でも多くの方が積極的にアウトプットできるようになることを願っています。
使用ツール
記事執筆には、主に以下のツールを使用しています:
- 音声文字起こしサービス「SoundType」
- スマホでもPCでも使えるものをお勧めします
- Mac×iPhoneなら「superwhisper」もおすすめ
- 会話を抽出してまとめる「NotebookLM」
- ブログ記事の「たたき台」作成に活用
- 複数の音声ソースをもとに一つのアウトプットが出せる
- 生成AI「ChatGPT」
- 細かい記事のフォーマット修正
- 出力された記事のレビュー
記事執筆の全体像
記事執筆では、以下のようなステップで進めます。
- 見出しの構築
- 見出しに沿って音声で話す
- 音声データを文字起こし
- 生成AIで記事のたたき台作成
- 記事の推敲と仕上げ
見出しの構築
まず、記事全体の「たたき台」となる見出し構成を考えていきましょう!
ここでの注意ポイントとしては生成AIに「記事テーマを考えて」と依頼するだけでは、あまり良い記事テーマが作成されないことです。(全体的に冗長な記事見出しになる)
効果的な見出しを作成するために、私は簡単な事例調査→自分の話したいことの構造化という手順を踏んでいます。
1. 似たテーマの記事を生成AIに検索させる
2. 記事から見出しのパターンを洗い出す
3. 構成を参考にしつつ自分の目的に合わせて見出しを構成する
4. 全体の流れを確認しながら見出し構成を最適化する
見出しが完成すれば、あとは内容に沿ってひたすら話していきます。
1.見出しに沿って記事の内容を話す
私の場合は、習慣的に朝と夜に散歩をしています。
1回10分程度なのですが、時間を利用して、その間にスマホで音声を録音しています。
最初は歩きながら喋ることに慣れないですが、割と好き勝手話しても最終的にAIが綺麗にまとめてくれるので、ここは頭の中のものを全て吐き出すイメージで話します。
ただ見出しの内容は網羅するように話すことを心がけると良いです。
2.音声データを生成AIにまとめて記事のたたき台を作成
録音データはNotebookLMを使って音声ソースを全て読み込ませます。
この記事では以下の点を記載してプロンプトを使っています。
- 事前に定義した見出しに合わせた内容を出力させる
- ライターのロールを与えて出力させる
あなたはプロのライターです。読者にわかりやすいよう、適切な改行や書き方を考慮しながら、音声データを元に以下の見出しに合わせてブログ記事を出力してもらえますでしょうか
## はじめに
## 使用ツール
## ライブライティングの全体像
### 見出しの構築
### まずは見出しにあわせてひたすら話す
### 音声データを生成AIにまとめて記事のたたき台を作成
### 生成AIの出力を自分らしい書き方に仕上げる具体的な方法
## 記事のクオリティを上げる
### 生成AIに足りない項目をレビューさせる
### 音声入力に慣れる
## まとめ
この時点の出力内容
はい、承知いたしました。提供された音声データに基づき、プロのライターとして読者に分かりやすいブログ記事を作成します。指定された見出し構成に沿って、適切な改行などを考慮しながら執筆いたします。
はじめに
皆さん、こんにちは。エンジニアとして日々忙しく働いていると、「アウトプットを習慣化したい」と思いつつも、なかなか時間が取れずにブログ記事などを書けていない、という方も多いのではないでしょうか。私もかつては、業務に追われて時間を見つけるのが大変でした。
そんな中で、最近注目されているのが「ライブコーディング」のように、生成AIと対話しながらコードを書くスタイルです。これにヒントを得て、「ライブライティング」という、音声を使って記事や情報を書き出す方法があるのではないかと考えました。
実は、この記事もそのライブライティングの手法を使って、大半を音声から書き起こしています。今回は、そのライブライティングの具体的な方法についてまとめました。この記事を読んで、一人でも多くの方が積極的にアウトプットできるようになることを願っています。
使用ツール
ライブライティングの実践にあたっては、いくつかのツールを使用しています。
まず、音声をテキストに文字起こしするサービスです。私は「toruno」というサービスを利用しています。音声認識の精度が非常に重要になるため、信頼できるサービスを選ぶことがポイントです。
次に、生成AIとして「Gemini 1.5 Pro」を活用しています。特にGemini 1.5 Proは、コンテクストウィンドウが非常に大きいため、入力した音声を基にある程度まとまった文章を出力してくれるのが強みです。好きなだけテーマについて話し、それをGemini 1.5 Proに渡すことで、ブログ記事の「たたき台」となるテキストを作成してもらっています。
ライブライティングの全体像
記事を書きたいと思っても、実際に書き始めるまでには高いハードルを感じることがあります。その理由の一つは、「どのように書き出せば良いか分からない」という課題感です。この壁にぶつかると、結局最初の段階で書くのをやめてしまいがちです。
ライブライティングでは、このハードルを下げるために以下のようなステップで進めます。
見出しの構築
まず、記事全体の「たたき台」となる見出し構成を考えます。ただし、ただ生成AIに「記事テーマを考えて」と依頼するだけでは、あまり良い記事にならないテーマが作成されることがあります。また、生成AIに見出し作成だけを任せると、あまり読みやすい文章にならないこともあります。
効果的な見出しを作成するには、少し工夫が必要です。例えば、同じようなテーマで書かれた日本語や英語の記事を生成AIに読ませ、見出しを洗い出させるという方法があります。さらに、その洗い出した見出しに対して、生成AIに重要と思われるポイントを挙げてもらうか、あるいは自分独自の基準や書きたい内容を追加するといった形で調整しながら見出しを構築するのがおすすめです。
また、Gemini 1.5 Proなどの生成AIは、テーマだけ話せばAI側から質問をしてくれるため、会話形式でテーマを深掘りしながら見出しを考えることも可能です。
このように見出しが完成すると、記事全体の構造や流れが見えてきます。
まずは見出しにあわせてひたすら話す
見出しによって記事の全体像が見えたら、次はその見出しに沿って、自分の考えや伝えたいことをひたすら音声で話していきます。
私の場合は、習慣的に朝と夜に散歩をしている時間を利用して、その間にスマートフォンの録音機能などで音声を録音するようにしています。最初は歩きながら喋ることに慣れないかもしれませんが、徐々に見出しに沿った内容でスムーズに話せるようになってくるので、この点は少し訓練が必要かもしれません。
音声データを生成AIにまとめて記事のたたき台を作成
録音した音声データは、まず音声文字起こしサービスを使ってテキスト化します。このテキストは、まだ推敲前の「生」の状態のたたき台です。
次に、このテキスト化した音声データをGemini 1.5 Proのようなコンテクストウィンドウの大きい生成AIに入力します。Gemini 1.5 Proは、入力された音声を元に、ある程度まとまった文章として出力してくれます。これにより、音声で話した内容がブログ記事の形に近い「たたき台」として整形されるのです。見出しと音声データを一緒に渡すことで、AIがある程度記事の体裁を整えてくれるでしょう。
生成AIの出力を自分らしい書き方に仕上げる具体的な方法
生成AIが出力した文章は、たたき台としては非常に有用ですが、そのままではどうしても堅苦しい表現になりがちです。また、生成AIにただ要約させるだけだと、必ずしも読みやすい文章にならないこともあります。
これを自分らしい、読者に読みやすい文章に仕上げるためには、いくつかの方法があります。
まず、生成AIへのプロンプトを工夫することが重要です。最初から読みやすい文章で出力してもらうために、「読みやすい文章とは何か」を自分の中で定義し、それをプロンプトとして指示したり、出力フォーマットを指定したり、内容について具体的に言及したりすることが推奨されます。
さらに、生成AIの出力する堅苦しさを解消し、自分らしい話し言葉に近い文章にするために、プロンプトに過去に自分で書いた記事の文体や、普段の話し言葉のサンプルを含めてみるという方法が有効です。私の経験では、このようなプロンプトを元に文章を生成させると、不思議と文脈に合った、より自然な内容で出力されるようになります。
これらの方法を組み合わせることで、生成AIを活用しつつも、自分らしさの詰まったオリジナリティのある記事を作成することができます。
記事のクオリティを上げる
ライブライティングで記事のたたき台を作成したら、さらに記事のクオリティを高めていきましょう。
生成AIに足りない項目をレビューさせる
たたき台となる記事には、情報量が不足していたり、適切な表現ができていなかったりすることがあります。情報量が固定しているか、内容に抜け漏れがないかを確認するためには、生成した文章全体をGemini 1.5 Proなどに入れ直し、内容として不足している観点がないかをチェックしてもらうことができます。これにより、記事に必要な情報が網羅されているかを確認し、質を高めることができます。
音声入力に慣れる
ライブライティングにおいて、音声入力の質は最終的な記事のたたき台の質に直結します。前述の通り、最初は見出しに沿って淀みなく話すのは難しいかもしれませんが、繰り返し練習することで、徐々に見出しの構成に合わせてスムーズに話せるようになります。この音声入力の精度や慣れも、記事のクオリティを左右する重要な要素となります。
また、文章が長すぎたり、逆に内容が薄かったりといった問題がある場合は、プロンプトを見直して重複している内容を削除したり、できるだけ文章を簡潔にすることを意識して音声入力を行うことも有効です。プロンプトに含める情報の整理や、入力する音声の質・構成を工夫することで、ある程度記事のクオリティを担保することが可能です。
まとめ
今回は、エンジニアのアウトプット習慣化の一助となるかもしれない「ライブライティング」という手法についてご紹介しました。音声を活用し、生成AIをうまく組み合わせることで、記事執筆のハードルを下げ、効率的にたたき台を作成し、さらに質を高めていくことが可能です。
このライブライティングについて、もし「こんな方法もあるよ!」といったより良いやり方をご存知でしたら、ぜひコメントで教えていただけると嬉しいです。
この時点でまあまあ悪くないクオリティですよね。
3.生成AIの出力を自分らしい書き方に仕上げる具体的な方法
文章をできるだけ自分のスタイルに寄せるために、過去の記事より自分の執筆スタイルに関して定義ファイルを作成しておきます。
具体的には、自分の過去の記事を通してどういった文体で書かれているかをmarkdownに出力しておきます。私の場合だと、このような定義のようです。
記事の文体表現.md
## トーン - 親しみやすく、フレンドリーな口調 - 厳しい言い方は避け、相手の感情に寄り添う優しい表現 - 軽妙でユーモアのある語り口を意識文体・表現
- 難しい概念をシンプルで分かりやすい言葉に落とし込む
- 体言止めを避け、ですます調で締める
- 抽象的な概念には具体的な事例を出す
- 複雑な説明の後には簡単で短い文を挿入
- 日本人が共感しやすい日常的な事例を使用
- 専門用語は必要に応じて使用し、平易な解説を加える
- 断定を避け、個人的な意見や仮説として提示
リズム
- 長い文と短い文を交互に配置
- 段落の長さに変化を持たせる
- 段落は20文字が3行続いたら最長とし、変化をつける
構成
- 挨拶から始まり、内容をざっくり説明
- 一般的な考え方やアドバイスに疑問を投げかける
- 読者の葛藤や矛盾を整理し、寄り添いながら説明
- 自分なりの意見や提案を柔軟に提示
- まとめとして共感的で押し付けがましくない結論を提示
内容のポイント
- 読者が抱える悩みを言語化する
- 一般論が必ずしも正解ではないことを示す
- 現実的なハードルを理解し、心が楽になる考え方を提示
- 明確な解決策よりも新しい視点や気持ちの軽くなる考え方を提供
- 適度に個人的な視点や考察を含める
記事の出力イメージ
- 親しみある挨拶と読者からの質問や悩みの紹介
- 一般的な考え方やアドバイスを示し、その問題点を指摘
- 自分の考えや提案を柔軟に提示
- 読者が感じる葛藤や矛盾を整理し、解決策を提示
こちらの記事でも紹介されている方法と同じやり方です。
https://zenn.dev/yoshiko/articles/my-ai-writing#%E4%BA%8B%E5%89%8D%E6%BA%96%E5%82%99
記事のクオリティを上げるためにすること
Vibe Writingで記事のたたき台を作成したら、さらに記事のクオリティを高めていきます。
生成AIに足りない項目をレビューさせる
たたき台となる記事には、情報量が不足していたり、適切な表現ができていなかったりすることがあります。
そのため一度公開前にChatGPTに通して、記事の観点抜け漏れや追記した方が良い点を指摘してもらいましょう。
情報量が不足している場合にはまた改めて音声を録音、NotebookLMに改めて音声ソースを追加し、記事を出力という手順を繰り返していくと質の高いアウトプットが出力できます。この記事でもChatGPTのレビューで音声ソースを1つ追加しています。
音声執筆に慣れる
音声入力の質が良いと、記事のたたき台の質も良くなります。
最初は見出しに沿って話すのは難しいですが、回数を重ねることでスムーズに話せるようになります。
最初は話している内容が薄いと感じることが多くなりますが、生成AIのレビュー&音声データ追加の手順を繰り返していくと最終的に記事の質を保つことができます。
まとめ
今回は、エンジニアのアウトプット習慣化の一助となるかもしれない「音声記事執筆」の手法についてご紹介しました。
音声を活用し、生成AIをうまく組み合わせることで、記事執筆のハードルを下げることができます。
さらに、効率的にたたき台を作成し、質を高めていくことも可能です。
他に、もし「こんな方法もあるよ!」といったより良いやり方をご存知でしたら、ぜひコメントで教えていただけると嬉しいです。