OpenAI、新画像生成モデルで「コードレッド」を継続

-

OpenAI、ChatGPT向け新画像生成モデル「GPT Image 1.5」を発表

OpenAIは、ChatGPT向けの画像生成モデル「GPT Image 1.5」の最新バージョンをリリースしました。この新モデルは、従来のバージョンと比較して、生成速度が4倍向上し、指示への追従性や編集の精度が格段に向上しているとされています。

AI分野における競争激化

今回の発表は、Googleが先日リリースした「Gemini 3」および「Nano Banana Pro」といった先進的なAIモデルへの対抗姿勢を示すものです。特に、GoogleのAIモデルがLMArenaリーダーボードで高い評価を得ている中、OpenAIは「コードレッド」を発令し、AI分野でのリーダーシップ奪還を目指しています。

GPT Image 1.5の主な特徴

GPT Image 1.5は、ChatGPTの全ユーザーおよびAPI経由で利用可能です。主な特徴は以下の通りです。

  • 生成速度の向上: 最大4倍の速度で画像を生成します。
  • 指示追従性の向上: より正確な指示に基づいた画像を生成します。
  • 精密な編集機能: 顔の類似性、照明、構図、色調などを維持しながら、細かい編集が可能になります。

競争環境とOpenAIの戦略

OpenAIは、GoogleのGemini 3の成功を受けて、当初1月に予定していた新画像生成モデルのリリースを前倒ししました。これは、AI分野における競争が激化しており、迅速な技術革新が求められていることを示しています。

生成AIの進化とChatGPTの体験向上

GPT Image 1.5の登場は、生成AI画像ツールの進化を示しています。従来のモデルでは、画像の微調整を行う際に全体的な再解釈が発生し、一貫性の維持が困難でしたが、GPT Image 1.5では、こうした課題を克服するための「クリエイティブスタジオ」のような機能が提供されます。これにより、ユーザーはより直感的に、意図した通りの画像を生成・編集できるようになります。

今後の展望

OpenAIは、ChatGPTの体験をさらに向上させるため、画像要素の活用を強化していく方針です。検索結果に視覚的な要素を多く表示し、出典を明確にすることで、測定単位の変換やスポーツスコアの確認など、様々なタスクでの利便性を高めることを目指しています。

「作成する際には、自分が作っているものを見たり、形作ったりできるようにするべきです。言葉だけでは伝えきれないストーリーを画像が語るとき、ChatGPTはそれらを含めるべきです」と、OpenAIのアプリケーションCEOであるFidji Simo氏は述べています。「素早く答えが必要な場合や、次のステップが別のツールにある場合、それらはすぐそこにあるべきです。これを行うことで、あなたの頭の中にあるものと、それを実現する能力との間の距離を縮め続けることができます。」

まとめ

OpenAIのGPT Image 1.5のリリースは、AIによる画像生成技術の飛躍的な進歩を示すものです。生成速度の向上、指示追従性の改善、そして精緻な編集機能の追加により、ユーザーはこれまで以上に創造的な活動を効率的に行うことが可能になります。Googleとの競争が激化する中で、OpenAIはこの新モデルを通じて、AI分野におけるリーダーシップを維持・強化していくことが期待されます。

合わせて読みたい  Apple株価(AAPL)、iPhone 17の爆発的売上で史上最高値を更新。アナリストは強気姿勢

カテゴリー

Related Stories