🔗 原文リンク: https://mp.weixin.qq.com/s/3fFwt4G-...
原创 阿真 阿真Irene 2026年4月29日 22:08 广东
みなさん、こんにちは!阿真(アイレン)です!
みなさん、タイトル詐欺っぽくてすみません、まずは怒らないで、最後まで読めばきっとインスピレーションが湧くはずです。なかなか良いものができました、今回は本当にPPTをかなり良く仕上げられるようになりました!連休前にみなさんにもシェアさせていただきます、これは本当に見逃せません。
実はこれ、ずっと前からやりたかったことなんです。以前Cozeのスキルについてシェアした記事で、「PPTスタイルクローン」というスキルを作ったことがあるんですが、その時はまだアイデアの輪郭しかありませんでした。参照画像や参照Webページの視覚的詳細を抽出し、そのスタイルを参照して、PPT生成のワークフローにスタイルを転移させ、PPTを出力するという構想でした。
当時はCozeでも作れたんですが、操作はまだ少し難しくて、どの参照画像がどのスタイルに適しているかを自分である程度把握していないと、転移の効果が今ひとつでした。先日見てみたら、スキルの評価は5人だけで、全員1点(最低1点)😅
それに私はちょっと完璧主義なところがあって、細部の統一感がないと受け入れられないんです。単体で見ればどれも悪くないんですが、ひとつのPPTの中だと、視覚的な一貫性が十分ではありません。
例えば以下の2枚、同じグループで生成されたものですが、黒い枠の部分が一方は四角、もう一方は角丸の凹んだ枠になっています。また、多くのシーンで1ページごとの小見出しの装飾にもかなり差があります。
じゃあ、解決策はないのか?以前は簡単ではありませんでしたが、今ならまたできる気がします。主にCodexがImage 2をサポートしたことで、私の探求欲が大幅に高まりました。PPT作成に使える素晴らしいスキルを編み出しました。参照画像のスタイルをうまく転移させ、自分の望むPPT効果を作り出せます。
ほぼどんなスタイルでも、Image 2があなたのために転移できます。
まずは出力結果をお見せしましょう。今回スタイル参照に使った画像はLandbook(https://land-book.com/)からです。Webデザインのインスピレーションサイトですが、視覚的なポイントは共通しており、シェアされているWebページ画像のレイアウト効果も非常に勉強になります。
思路のシェア
このスキルの動作プロセスと私の考え方をみなさんとシェアさせていただきます。
まず、このスキルは編集可能なPPTを作るルートではなく、「まず視覚スタイルをアセット化し、Image 2でページ全体の画像を生成し、最後に画像版PPTXとしてパッケージングする」というルートを採っています。これは主にImage 2自身の強力な能力に支えられて実現しています。
以下が私の考え方です:
ワークフロー
-
タスクタイプの判定:GPTがまず、スタイル抽出、スタイルライブラリの呼び出し、ドキュメントからPPT/画像への変換、既存画像版PPTの修正、単一ページのビジュアル再作成のどれかを判断します。
-
スタイルの選択または抽出:Style source(スタイル参照元として使うリソース)とStyle Lock(視覚的詳細を固定)をそれぞれ1つだけ使用することを明確にし、過去の参照画像や他のスタイルが混入するのを防ぎます。
-
コンテンツの理解:ドキュメントやテーマから、ワンスンテンスの主張、ターゲット層、3〜6個のコアとなる観点、可視化可能なオブジェクト、推奨ページ数を抽出します。これはPPTのコンテンツを準備するためです。
-
制作パラメータの確認:ページ数、アスペクト比、出力タイプ、言語、テキスト密度、日付/作者/ロゴ/透かしの要否。デフォルトは日本語優先、16:9、低密度、日付なし。ここで視覚的詳細を固定します。
-
ページタイプの計画:表紙、目次、コアとなる観点、比較、プロセス、フレームワーク、タイムライン、データ、ケーススタディ、チェックリスト、結論などのページタイプから、各ページに役割を割り当てます。ここでも視覚的詳細を固定します。
-
まずドキュメントを生成:複数ページのプロジェクトでは、必ず最初にoutline.md(コンテンツの枠組み)とprompts.md(完全なプロンプト)を生成し、prompts.mdには完全なStyle Lockを含めます(これは複数画像間の視覚的詳細の統一のためです)。
-
2段階生成:複数ページのプロジェクトでは、まずサムネイルボードを作成して全体のリズムを固定し、その後1ページずつ独立した完成画像を生成します。ここではまず多グリッド画像を作成し、異なるページの画像レイアウトの一貫性をより良く維持することを選択しました。
-
ユーザーによる画像確認:生成後、まず画像を表示またはリストアップし、確認が取れてからPPTXとzipを組み立てます。
-
部分的な修正:指名されたページを作り直し、他のページと同じスタイルシステムを保持します。
-
最終パッケージの品質チェック:スタイルの一貫性、日本語の可読性、情報が混み合っていないこと、ページタイプの一致、黒い外枠がないこと、偽の日付がないこと、1ページ1画像、PPTXが全画面で画像を敷き詰めていることを確認します。
使い方
推奨ツールはCodexです。十分に賢く、私が必要とするテキストコンテンツをうまく理解し出力でき、さらにテキストを含む極めて高品質な画像をバッチ処理で完成させることができます。使えない場合は、Lovart、LibTV、または扣子(Coze)を試すこともできます。
ステップ1:スキルのインストール
まずはこのスキルをインストールします。
ステップ2:スタイルDNAの抽出
インストールが完了したら、画像からPPTを作るこのスキルを呼び出すよう指示するか、直接visual-style-ppt Skillを呼び出すよう伝え、スタイルを参照・模倣したい画像やWebページのリンクを渡し、その画像のスタイルDNAを抽出するよう伝えます。
ステップ3:PPTの生成
スタイルが抽出されたら、次は指定したパスのドキュメントやドキュメント添付ファイルを渡してPPTを生成させます。ドキュメントがない場合は、Codexに資料を探させるのでも構いません。
ただしこの段階ではまだPPTは生成されません。まず最初のファイルが生成され、私たちが確認するのを待ちます。このステップではoutlineファイルとpromptsファイルが生成されます。
outlineドキュメントは実際にはPPTのテキストアウトラインです。コンテンツをよりコントロール可能にするため、私はこのドキュメントを先に単独で出力して確認するようにしています。コンテンツのアウトラインにまだ問題がある場合は、コンテンツを選択してから【会話に追加】で修正できます。
次にpromptsですが、これはみなさんもお馴染みだと思います。プロンプトです。違うのは、このプロンプトの前に、制作パラメータ基準のデフォルトと統一、そしてStyle Lock、つまりスタイルと階層の詳細をしっかりと固定しています。
さらに進むと、サムネイルと各PPTページの詳細なプロンプトが見えます。これもスタイルとコンテンツをコンテンツ段階でよりコントロール可能にするためです。
ステップ4:画像の生成
上記2つのドキュメントの詳細が確認できたら、画像を生成させることができます。「画像を生成」または「続けて」と伝えるだけでOKです。画像生成は2ステップに分かれており、まず多グリッドを出し、満足いくまで修正してから、1枚ずつ出力します。
もちろん、以上のことが面倒で、手間がかかる!と思うなら、直接PPT画像を出力させることもできます。これは主に細部をコントロールするためのものです。
最終的な大きな画像と9グリッドのサムネイルにはまだ少し差があるかもしれませんが、私の試行では、変化の方向は通常より良くなる方向なので、受け入れ可能です。
1回目ですべての画像が出力された後も、さらに調整を続けることができます。例えば、元画像の番号が間違っていた場合、修正を続けるよう指示できます。
ただし、相変わらずImage 2の人物像の細部には問題があります。
他にもテキストの細部を修正したい場合は、スクリーンショットを撮って枠で囲い、修正を指示できます。
ステップ5:ファイルのパッケージング
画像も確認が完了したら、直接PPTをエクスポートするか、または「パッケージ」と伝えます。最終的に確認したすべての画像、サムネイル版、アウトライン、プロンプトファイルが納品されます。誤解しないでいただきたいのは、ここでのPPTは依然としてテキストを修正できない画像が組み合わさったものです。修正が必要な場合は、必ず前のステップで完了してからzipパッケージを作成してください。
最終的に出力されるzipパッケージにはすべてのファイルが含まれます。
その中のStyle-usedは再利用可能なスタイルテンプレートです。これは後続の生成、修正、再利用のためのスタイル設定ファイルです。その役割は以下の通りです:同じスタイルテンプレートを呼び出してインフォグラフィックを再度生成しても、スタイルはうまく維持されています。つまり、さらにPPTページを追加したい場合も、このベースから直接コンテンツを追加すれば完全にOKで、決して9枚以内に限定されるわけではありません。
まとめ
はい、ここまでで私の考え方全体と操作方法もだいたいシェアし終わりました。今後、みなさんがいつも使っているスタイルをPPTに転移させたい場合や、実験的なPPTスタイルを試したい場合なども、非常に便利です。
最後に、このスキルはGitHubでシェアしています。リンクは以下です。気に入ったら阿真のGitHubに🌟をつけてくださいね
https://github.com/irenerachel/visual-style-ppt-skill
創作は大変、頭を使うしトークンも消費します(笑)、もし内容がみなさんのヒントやお役に立てば、阿真に無料の猛猛三連(いいね・シェア・フォロー)で励ましてください〜!
もうすぐ連休ですね、阿真は連休中は遊びに行くので、連休中は更新しないかもしれません。みなさん、楽しい連休を〜😄
また次回!