はじめに
Qiitaをご覧の皆さん、こんにちは。会社員として働きながら、趣味のガジェットレビューでショート動画を制作しています。
以前の私は、1本の動画制作に平均5〜6時間も費やす「編集沼」にどっぷりハマっていました。しかし、根本からワークフローを見直し、「人間がやるべきこと」と「機械に任せるべきこと」を再定義することで、現在では1本あたり約1.5時間で完成させられるようになりました。
この記事は、特定のツールを推奨するものではありません。そうではなく、私がボトルネックを特定し、タスクを分解し、最適なツールを組み合わせて自分だけのワークフローを設計した、その思考プロセスそのものを共有することが目的です。
Step 1: ボトルネックの特定 ― 「探す」「文字起こし」という名の時間泥棒
ワークフロー改善の第一歩は、魔法のツールを探すことではなく、現状を冷徹に分析することです。私はまず、自分の作業時間をストップウォッチで計測し、どの工程にどれだけ時間がかかっているかを洗い出しました。
- ① 素材プレビューとクリップ候補の洗い出し(約120分)
- ② カット編集(約30分)
- ③ テロップの文字起こしと入力(約90分)
- ④ デザインとタイミング調整(約40分)
- ⑤ BGM・効果音の選定(約30分)
- ⑥ 書き出し・投稿(約10分)
【背後にある思考ロジック】
計測結果から明らかになったのは、全工程の約7割が、①の「長尺動画から面白い部分を探す作業」と、③の「話している内容を聞き取って文字にする作業」に費されていたという事実です。
これらは創造性が低く、再現性の高い単純作業です。言い換えれば、最も自動化に適したタスクであり、動画制作における最大のボトルネックでした。この2点を解決しない限り、どんなに高性能な編集ソフトを使っても、根本的な時間短縮には繋がらないと結論付けました。
Step 2: タスクの再定義とツール選定の基準
ボトルネックが特定できたので、次は「ツールに何をさせるか」を具体的に定義します。私がツールに求めた「役割」は以下の2つです。
- 優秀なアシスタントディレクター: 私の代わりに長尺動画を全て見て、面白くなりそうな箇所の「候補」を複数提案してくれる役割。
- 高速な文字起こし担当者: 私が話した内容を、高速かつ正確にテキスト化してくれる役割。
【背後にある思考ロジック】
ここで重要なのは、ツールに完璧を求めないことです。AIに「完璧なショート動画」を全自動で作らせようとするのではなく、あくまで「最も時間のかかる単純作業」を肩代わりしてもらう、というスタンスでツールを選びます。この思考に基づき、ツール選定の基準を以下のように定めました。
- 基準A: 候補の提案能力: ゼロから探す手間を省いてくれるか?
- 基準B: 日本語の文字起こし精度: 手戻り(修正作業)が少ないか?
- 基準C: ワークフローの分断: 複数ツールをまたぐ際の、ファイル書き出しや読み込みの手間は許容範囲か?
Step 3: 私の現在のワークフローと、その判断理由
上記の思考プロセスを経て、私は「AIによる下処理」と「人間によるクリエイティブな仕上げ」を明確に分離した、以下のワークフローを構築しました。
1. 【機械の領域】AIによる「素材の一次加工」
まず、撮影した長尺動画(約20分)を、Webベースの動画生成サービスにアップロードします。世の中には、動画のハイライトを自動で抽出してくれるAI Clip Makerと呼ばれるツールがいくつか存在します。
これらのツールは、動画内の会話のトーン、キーワード、無音部分などを解析し、SNSで注目されやすいであろう部分を自動で切り出してくれます。
【なぜこの手法を選ぶのか?】
この工程の目的は「完璧なクリップを見つけること」ではなく、「検討に値する候補を高速でリストアップすること」です。20分の素材を自力で見るという行為を完全に捨て、AIが提案してくれた2〜3分の候補リストを確認するだけにしました。これにより、私の役割は「探す人」から「選ぶ人」に変わり、意思決定の負荷が大幅に軽減されました。
2. 【人間と機械の協業】「下書き字幕」の生成と修正
次に、選んだクリップに対して自動字幕生成機能を実行します。私が現在メインで使っているShort AIのようなサービスでは、クリップ生成から字幕生成までがシームレスに行えます。
生成された字幕は、専門用語などで誤認識があるため、100%完璧ではありません。しかし、これは「白紙のキャンバス」ではなく「8割方完成した下書き」です。私はこの下書きの誤字脱字を修正し、専門用語を正しい表記に直す作業だけを行います。
【なぜこの手法を選ぶのか?】
「ゼロから1を生み出す」作業は、精神的にも時間的にも最もコストがかかります。AIに「0→1」の部分(音声からテキストへの変換)を担ってもらい、人間は「1→1.2」にするための、より付加価値の高い修正作業に集中します。これにより、創造性を維持しつつ、単純なタイピング作業から解放されます。
3. 【人間の領域】クリエイティブな「味付け」
AIによる下処理が終わった素材を、最終的な仕上げのために使い慣れた動画編集ソフト(私の場合、PC版のCapCutやDaVinci Resolve)に読み込みます。
ここからは、AIには真似のできない、完全に人間のクリエイティビティが求められる領域です。
- 「間」の調整: 笑いや驚きを誘うための絶妙な間の取り方
- テキストの演出: 最も伝えたいキーワードを、どのタイミングで、どのようなアニメーションで見せるか
- 効果音の追加: 視聴者の感情を揺さぶるための効果音の挿入
【なぜこの手法を選ぶのか?】
動画の「面白さ」や「分かりやすさ」といった本質的な価値は、最終的にこうした細やかな演出によって決まります。自動化によって生み出した時間を、全てこの「味付け」の工程に投資することで、動画のクオリティを落とすことなく、むしろ向上させながら制作時間を短縮することが可能になります。
まとめ:あなた自身の「最適解」を見つけるために
私が紹介したワークフローは、あくまで現時点での私にとっての「最適解」に過ぎません。
重要なのは、ツールを盲信するのではなく、
- まず自分の作業を計測し、ボトルネックを特定する。
- 自動化したいタスク(役割)を明確に定義する。
- その役割を果たせるツールを複数試し、自分の目的に合ったものを選ぶ。
- 「機械に任せる部分」と「人間がやるべき部分」を明確に分離したワークフローを設計する。
という思考のフレームワークそのものです。
この記事が、皆さんが自分自身の非効率な作業から解放され、より創造的な活動に集中するための「設計図」を描く一助となれば幸いです。