0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【ChatGPT】OpenAIが、画像生成AIのレベルを引き上げました。

Last updated at Posted at 2025-03-26

 どうも、カーブミラーです。

 今回は、OpenAIが、ChatGPTの画像生成AIのレベルを引き上げました。

本記事は、ChatGPTについての
記事です。    あしからず。

 ChatGPT等の動作状況を知らせる
  OpenAIのステータスページ。
   OpenAIステータス


 こちらも載せますね。
  ChatGPTが使えない?ログインできない・反応しない原因やエラー時の対処法を解説


 では、【本題】です。

 今回は、
  OpenAIが、
   ChatGPTの
    画像生成AIのレベルを
     引き上げました。

 DALL-E3から
  DALL-E4ではありません。

 どういうものなのか?


 ゆうべ3時に
  OpenAIが、
   YouTubeで
    LIVEを行ないました。
     OpenAI公式YouTube LIVE

 ChatGPTとSoraにおける4o画像生成

 Sam Altman、
  Gabriel Goh、
   Prafulla Dhariwal、
    Lu Liu、Allan Jabri、
     Mengchao Zhongが登場。

 4o画像生成の紹介と
  デモを行いました。

 その後、
  OpenAI公式ページで
   詳細が発表されました。
    Introducing 4o Image Generation

(ChatGPTわかりやすく記事に)
OpenAIは、最新のAIモデルであるGPT-4oに画像生成機能を統合し、ChatGPT内で直接画像を生成できる新機能「Images in ChatGPT」を発表しました。この機能は、ChatGPTのすべてのサブスクリプション層(Plus、Pro、Team、Free)で利用可能となります。

主な特徴と改善点:

  • 属性の正確な結びつき(バインディング)の向上: GPT-4oは、複数のオブジェクトや属性を含む画像生成において、高い精度で要素間の関係性を維持します。例えば、5~8個のアイテムを含むプロンプトでも、色や形状の混同を避け、15~20個のオブジェクトに対しても正確なバインディングを実現しています。

  • テキストレンダリングの改善: 画像内のテキスト生成において、従来のモデルよりも明瞭で一貫性のあるテキストを生成します。これにより、ポスターやインフォグラフィックなど、テキストを含む画像の品質が向上しています。

  • オートレグレッシブ手法の採用: 従来の拡散モデルとは異なり、GPT-4oはオートレグレッシブ手法を使用して画像を生成します。これにより、テキストレンダリングや属性の結びつきが向上し、より高品質な画像生成が可能となっています。

安全対策と利用制限:

OpenAIは、不適切なコンテンツの生成を防ぐため、性的なディープフェイクや有害な画像の生成をブロックする強力な安全対策を実装しています。また、生成された画像には、AIによって作成されたことを示すメタデータが含まれており、透明性を確保しています。

利用方法:

この新機能は、ChatGPTのすべてのユーザーが利用可能で、無料ユーザーも一定の制限内で画像生成を試すことができます。ただし、無料層の使用制限はDALL-Eと同様で、需要に応じて変更される可能性があります。

OpenAIのGPT-4oによる画像生成機能の統合は、AIによるコンテンツ生成の新たな可能性を示しており、ユーザーにとってより直感的で有用な体験を提供します。


 ChatGPT のデフォルトの
  画像生成器として、
   本日(2025/03/26)より
    Plus、Pro、Team、
     および Free ユーザー向けに
      展開されます。

  Enterprise および Edu でも近日中に
   利用できるようになります。

 ここからわかることは、
  GPT-4oがマルチモーダルモデルで
   GPT-4oだけで描画できる

    ということのようです。

 今後、DALL-E3はGPTsを
  経由してなら使えるが、
   直接は使えなくなります。

 また、
  Sora でも使用できます

  Prompt入力時に、
   Image/Videoの選択ができます。
    この切り替えは
     継続されますので、
      画像と動画を意識的に
       切り替える必要が
        あります。

  日本語Promptも
   使えましたので
    使い勝手がよくなりました😸


 ここからは
  使ってみてわかったことを。

 画像は、
  一貫性が保たれます。

 日本語が描画できます👍
  どうやら韓国語も描けるようです。
   上記ページにありました。

  テキストは
   小さくても
    ほぼ大丈夫な感じ。

 描画は
  少し時間が掛かります。
   画像は少しずつ浮かび上がります。

 画像ですが、
  DALL-E3の編集機能が
   使えません。

  Prompt入力での
   編集になります😭

 ダウンロードすると、
  これまではWebPでしたが、
  これからはPNGになります😅

 画像のPromptの
  コピーができません。

  そのため、
   書き出すように
    指示する必要があります🤔

 縦長の画像は
  これまでちょくちょく
   横倒し画像が生成されました。

  試したところ、
   思ったとおりに
    縦長画像になりました👍

  こんな感じ。
combined_thumbnails_vertical.jpg

 みなさんの
  作品制作の糧に
   なれば、幸いです。

 今回は、ここまで。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?