この記事は、社内向けAI勉強会として、GeminiなどのGoogle AIサービス系についてまとめた記事になります。
Geminiについて、社内向けに説明しないといけないとう場面で参考にしてください。
Geminiとは?
Google の AI「Gemini(ジェミニ)」は、Google が開発・提供している
いろんな情報を扱えるマルチモーダル AIです。
マルチモーダルAIとは?
テキスト、画像、音声、動画など、複数の異なる種類の情報を同時に処理できるAI技術
Geminiが得意なこと・特徴
- Google 検索と連携しているので、いつでも最新の情報をつかむことができる
- 市場の最新トレンド調査や専門分野の新しい論文など
- さまざまな入力方法に対応しているので、意図を汲み取って的確な回答をしてくれる
- コンテキスト ウィンドウ(処理できる最大のトークン数)が多い
- それを生かして、動画の解析や深いリサーチができる
- Textから動画・画像を生成することができる
- Gemini をカスタマイズできる「Gem」機能
- Gemini と対話しながらアイデアを形にできる「Canvas」機能
- 使えば使うほど、パーソナライズされていく
Geminiの機能
① AIチャット
Gemini の最も基本的な使い方です。
聞きたいことをそのまま質問したり、文章の要約・改善、コードの生成、アイデア出しなど、
AIとの対話を通じてあらゆる作業を進めることができます。
- 疑問点の解決
- 情報収集
- アイデアブレスト
- ドキュメント作成
- コードレビュー・バグ調査
- 文章添削・翻訳
Gemini は入力の意図を汲み取るのが得意なので、
“雑に聞いても” かなり良い回答が返ってきます。
② Gem機能
Gemとは、AIを自分好みにカスタマイズするための機能です。
性格や得意分野、話し方などを設定して、特定の目的に特化した自分だけのAIを作成できたいり、
毎回同じ条件を入力する手間を省き、効率的なやりとりができます。
【Gemを書くときのポイント】
-
役割を定義する
- 例:「あなたは、地方の書店の SNS 担当者です。」
-
タスクを明記する
- 例:「あなたの目標は、エンゲージメントの高い Instagram のキャプション案を 3 〜 5 個生成することです。」
-
アウトプットを明確にする
- 例:「各キャプションには、関連するハッシュタグと行動喚起(CTA)を含めてください。」
例:入力された英語を4パターンで翻訳してくれるGem
あなたはプロの翻訳家です。
英語が入力されたら、適切な日本語訳を下記の4パターンで返してください。
・忠実な直訳
・日本人が違和感なく読めるような意訳
・最大100字程度で簡潔に要約した日本語文
・文章のトピック領域でよく出てくる単語のピックアップと簡単な解説
コピーしやすいように、簡潔に4案を書いてください。
それを選んだ理由などは不要です。
コピーだけ返してください。
いずれのパターンでも、日本語として自然で、文法としても誤りがないように気をつけてください。
③ Deep Research
リサーチアシスタントとして、ユーザーの代わりに数百ものウェブサイトを自動的に参照し、得られた結果を分析して、分析情報のレポートを数分で作成してくれる機能です。
ツールから、Deep Researchを選択して、プロンプトを投げるだけで使えます。

日本国内におけるオンライン学習市場の現状と今後3年の予測を調査し、
主要プレイヤー、ユーザー層、成長要因、参入障壁を分析してください。
④ Canvas
Canvas は、Gemini アプリに追加された新しいインタラクティブな機能です。
AIと対話しながら、思いついたアイデアをもとにテキストを作成し、内容を練り上げ、完成したものを簡単に共有することができます。
特にこのようなことが得意です。
-
企画書・blog を記事にまとめる
- 執筆したり、記事にまとめたり、企画案考えたりする時に使える
-
HTML / CSS / JavaScript も書いてくれる
- 「業務上でこういう社内ツール欲しいよね・エンジニアの手を借りないとできないね」みたいなものが簡単に作れる
ツールから、Canvasを選択して、プロンプトを投げるだけで使えます。

⑤ ガイド付き学習
ガイド付き学習は、いわゆる家庭教師です。
わからないことを視覚的な参照資料、教育リソースを提供しながら提供してくれます。
新しく始めたいけど、どこから始めればいいかわからない時に使えます。
ツールから、ガイド付き学習を選択して、プロンプトを投げるだけで使えます。

⑥ Nano Banana / Imagen
Nano Banana / Imagen は、画像生成・写真修正ツールです。
新しく画像を生成したり、とった写真を加工したい時に使えます!
【画像生成プロンプトを書くときのポイント】
以下の要素を含めるとより正確な画像が生成できます。
-
主題
- 画像の中心となる人、モノ、風景など、最も重要な要素
-
コンテキスト
- 主題がどこにあるのか、どのような状況かの設定
-
スタイル
- 写真、イラスト、3D レンダリングなど、画像全体の表現方法
さらに詳細に書くなら
-
構図
- 「クローズ アップ」「ワイド ショット」「一点透視」「三分割構図」など
-
色調
- 「清潔感のある白基調」「落ち着いたネイビー トーン」
-
テキスト
- テキストの有無
-
ネガティブ プロンプト
- 「ウォーター マークなし」「ぼやけた画質を避ける」「余分な背景や物体を除外する」
▼主題 (Subject)
被写体:広々としたモダンなリビング ルーム, インテリアのデザイン写真, スタイリッシュなデザインのリビング照明
状態:北欧モダン スタイルで家具が配置されている, 暖かく居心地の良い雰囲気, 窓から明るい光が差し込んでいる, 都市のパノラマビューが窓の外に見える, 白い壁と明るいフローリング,男性と女性がくつろいでいる
▼スタイル (Style)
アート性:おしゃれな建物, 写実的, 清潔感のあるモダンな雰囲気
品質・詳細度:高解像度, 家具やテキスタイルの詳細な質感, リアルな影と光の表現, デザインの整合性, 8K, 縦横比 16:9
▼コンテキスト (Context)
制作背景:住宅のリフォーム企業, パンフレットに載せるイメージ画像
伝えたいもの:顧客が自分ごと化できる, 家庭の温かさを感じる, 住みやすくおしゃれな理想の家
▼構図 (Composition)
カメラ アングル:部屋全体を見渡せる広角ショット, 中心からの視点, バランスの取れた構図
▼色調 (Color)
色味:柔らかな白を基調とした明るく温かいイメージ
ライティング:柔らかい自然光, 明るく開放的な雰囲気
▼テキスト (Text)
"Imagen"と書かれたポスター
▼ネガティブ プロンプト
排除するもの:人がいない, 乱雑さ, 暗さ, 時代遅れの家具, 低品質, 不自然な配置, 文字, ウォーターマーク, 文字やロゴが書かれた物品
⑦ Veo
Veoは、動画生成ツールです。
【動画生成プロンプトを書くときのポイント】
映像を生成する時は、以下の要素を含めると意図通りになりやすいです。
-
被写体
- 動画に登場させたい人物、動物、モノ、風景など
-
コンテキスト
- 被写体が存在する場所や背景の状況
-
アクション
- 被写体の動作や変化
-
スタイル
- 映像のジャンルや表現技法
さらに詳細に書くなら
-
カメラの動き
- 「空撮」「ローポジションからのパン」「目線の高さでズームイン」など
-
構図
- 「ワイド ショット」「クローズ アップ」「オーバー ショルダー構図」
-
雰囲気
- 「暖色で柔らかな朝の光」「青色を基調とした夜の街」
▼被写体(Subject)
被写体:大理石のキッチンカウンターに置かれた、洗練されたクローム製の Aroma Pro。上質なニットを着た、30 代の洗練された雰囲気の男性
場所:朝日が差し込むモダンなキッチン
▼スタイル(Style)
高品質なライフスタイル雑誌の広告のような、都会的で洗練されたコマーシャルスタイル。温かみのあるシネマティックトーン
▼コンテキスト(Context)
制作意図:新製品のコーヒー メーカー「Aroma Pro」の PR 動画
ターゲット:高品質なライフ スタイルを求める 30 代以上の男女
▼アクション(Action)
Aroma Pro から美味しそうなコーヒーがカップに注がれ、優雅に湯気が立ちのぼる。そのコーヒー カップを手にとり、男性が優しい表情でカメラに語りかける
▼構図(Composition)
コーヒーが注がれる瞬間のクローズアップ、製品と人物の両方を捉えるミディアム ショット、奥行きのある空間を活かした構図
▼雰囲気(Ambiance)
柔らかな朝の光が差し込む、温かく落ち着いた雰囲気、清潔感と高級感のある空間、穏やかな朝の始まりを感じさせる色調
▼カメラの動き(Camera Movement)
Aroma Pro への緩やかなズームイン、カップに注がれるコーヒーへのスムーズなパン、男性の表情へのソフトなパンアップ、最後に全体を捉える
【音声生成プロンプトを書くときのポイント】
音声を生成する時は、以下の要素を含めると意図通りになりやすいです。
-
言語
- 話し言葉の言語や発音のアクセント
-
テンポ・リズム
- BGM やナレーションのスピード感は、動画の印象を大きく左右する
-
音声の種類
- ナレーション・セリフ・BGM・効果音(SFX)など
-
音源の指定
- 特定の楽器、音源タイプ、ジャンルなど
-
ボリューム・強弱
- 音の大きさや強さ、抑揚の指定など
-
ムード・感情
- 音全体が伝える感情や空気感は、シーンの理解や共感を深める
▼テンポ・リズム(Tempo / Rhythm)
心のゆとりを感じるような落ち着いたリズム、聞いていて遅いとは感じないテンポで
▼音声の種類(Type)
BGM:朝にリラックスできるような落ち着いた音楽
セリフ:『この Aroma Pro で、最高の一日が始まります』セリフと口の動きが自然に、完全に一致すること
▼ムード・感情(Mood / Emotion)
動画を見るとリラックスでき、コーヒーとともに贅沢な休息時間が提供されるようなイメージ
▼言語(Language)
標準的な訛りのない日本語
▼ボリューム・強弱(Volume / Dynamics)
抑揚はあまりつけず、終始落ち着いたボリュームで
▼音源の指定(Specific Sound source)
BGM:上質なジャズ
効果音:ドリップ後のコーヒーが注がれる音
セリフ:男性の低く柔らかな声
⑧ 時間指定アクション
Geminiのチャットで 〇〇(日時)になったら、××して のようににお願すると、時間を指定したアクションをセットできます。
ただ、1プロンプトにつき1日1回以上のスケジュール設定できないみたいです。
また、時間指定アクションの一時停止・再開は、設定の予約アクションから変更することができます。
朝10時になったら、前日のNBAの試合結果と、現在のレイカーズの順位を教えてください。
GoogleのAIサービスは、Geminiだけじゃない
Google Workspace AI
以下のGoogleのツールでも、Geminiを使うことができる
- Google Drive
- ドキュメント
- スプレッドシート
- Gmail
- Google Meet
NotebookLM
ユーザーがアップロードした Google ドキュメントやスライド、PDF、特定の Web サイトの URL などを情報源として、回答を生成してくれる、情報の整理に特化しているAIツールです。
整理したい情報をいろいろ情報源として追加して、以下を生成してくれます。
- チャットで返答
- 音声解説・動画解説の作成
- マインドマップの作成
- レポートにまとめる
- テストの作成
Gemini Live(Gemini アプリのみ)
カメラで映しながら、「これ何?」みたいなコミュニケーションをAIとできるツールです。
ぼくは、冷蔵後の野菜とかを映しながら、どんな料理できる?みたいなに使ってます。
他にも、商談・面談練習相手になってくれたりするそうです。
Flow
Veoよりも映画・映像制作に特化したAIツールです。
プロジェクトごとにプロンプト管理できたり、特定のフレームから生成し直したりできます。
Whisk
モデル、シーン、スタイルで自分の好きな画像を入力してそれらを組み合わせてた画像を生成、その後動画も生成できるAIツールです。
Gemini CLI
コマンドライン上でGeminiを使えるツール
まとめ
Google の Gemini は、単なる「チャットAI」ではなく、情報収集・文章生成・コード補助・画像/動画生成・学習支援・自動化 までを一つでカバーできる、“総合的なAIプラットフォーム” です。
Gemini が提供している機能は多岐にわたりますが、まずは AIチャットを使ってみてください!
また、紹介したいろんな機能もどんどん触って、自分にとって最適な使い方を探してみてください。
最後まで読んでくださってありがとうございます!
普段はデザインやフロントエンドを中心にQiitaに記事を投稿しているので、ぜひQiitaのフォローとX(Twitter)のフォローをお願いします。
