GPT Imagesは「Photoshop」を終わらせるのか─ プロンプト1発で“撮影”までやってくるAI

GPT Imagesは「Photoshop」を終わらせるのか─ プロンプト1発で“撮影”までやってくるAI TECH
GPT Imagesはカメラマンだった

普段、私は Stable Diffusion Forge + FLUX.1 を使っている。
これはこれで、かなり良いモデルだ。

特に、

  • リアルな質感
  • 自然な光
  • 違和感の少ない人物

このあたりは、非常に優秀だ。

ただし──
今回、ちょっとした“実験”で気付いてしまった。

「これ、役割が違うな」と。


春の写真を“合成”してみた

使用したモデルの元画像

FLUX.1で生成したベースのモデル元画像
FLUX.1で生成したベースのモデル元画像

使用したプロンプト

a young woman standing under a cherry blossom avenue in spring,
soft pink sakura petals falling gently,
background heavily blurred with strong creamy bokeh,
clean separation between subject and background,
background simple and non-distracting,
subject in sharp focus, ultra sharp hair strands,
fine detailed individual hair strands visible,
high contrast edge lighting on hair,
soft rim light outlining the hair,
subtle pink light reflecting on hair,
wind gently moving her hair,
smooth realistic skin texture, natural skin tone,
photorealistic, high detail, professional photography,
85mm lens, f1.8, shallow depth of field,
studio quality lighting, soft natural sunlight,
balanced exposure, no harsh shadows,
background color contrast with subject hair,
no background distractions, no clutter

テーマはシンプル。

  • 桜並木の背景
  • 女性のポートレート
  • 自然な合成写真

いわゆる「よくあるビジュアル」だ。
スナップという形容が似合う写真。

FLUXでやれば、簡単にそれっぽい絵は出る。
しかし実際にやってみると、違和感が出る。

FLUX.1で生成したベースのモデル元画像を元に、桜並木のシチュエーションで生成。
FLUX.1で生成したベースのモデル元画像を元に、桜並木のシチュエーションで生成。

問題はここだった

  • F値や焦点距離が効かない
  • ボケが“雰囲気”でしかない
  • 細かい指示が消される(花吹雪とか)
  • 全体が“無難な現実”に収束する

つまり、

「破綻しないが、意図も通らない」


GPT Imagesでやってみた結果

FLUX.1で生成したベースのモデル元画像を元に、GPT Imagesで桜並木のシチュエーションを生成。ドラマティック。
FLUX.1で生成したベースのモデル元画像を元に、GPT Imagesで桜並木のシチュエーションを生成。ドラマティック。

ここで GPT Images を使ってみた。

同じことを、同じようにやっただけだ。

結果──

  • プロンプト通りに構図が変わる
  • 焦点距離・F値がちゃんと効く
  • 背景も含めて“写真として成立する”
  • 髪、光、空気感までコントロール可能

そして何より、

「絵にドラマが乗る」

焦点距離を85mmから35mmに変えてみると、こんな感じ。

GPT Imagesで桜並木のシチュエーションで生成した画像の焦点距離を変更。プロンプトの追従性が高い。
GPT Imagesで桜並木のシチュエーションで生成した画像の焦点距離を変更。プロンプトの追従性が高い。

しっかり、背景のパースペクティブが変わる。


比較して分かったこと

項目FLUXGPT Images
リアルさ
指示の再現性
構図変更
写真文法
演出力

決定的だった実験

GPT Imagesで様々なシチュエーションでのロケ撮影
GPT Imagesで様々なシチュエーションでのロケ撮影

「同じ子」で、シチュエーションを変える。

  • 桜並木
  • 海辺
  • 夜景
  • 高級ホテル前
  • 車と並ぶカット

これをやってみた。

結果は見ての通りだ。

👉 別人にならない
👉 構図は変わる
👉 空気感は成立する


これ、SDでやるとどうなるか

正直に言う。

地獄です。


必要なもの👇

  • LoRA調整
  • ControlNet
  • 構図ガイド
  • プロンプト微調整
  • 生成ガチャ

それでも、

  • 顔が崩れる
  • 車が変形する
  • 構図がズレる

GPT Imagesは何をしているのか

一言で言うと、

「Photoshopではなく、撮影をしている」


FLUXは

👉 “画像を作る”

GPT Imagesは

👉 “写真を撮る”


ビジネス的に何が起きるか

ここが本題。


■ ロケ撮影が不要になる

  • 天候関係なし
  • 場所制約なし
  • スタジオ不要

■ 自社素材で展開可能

  • キャンペーンガール
  • 自社車両
  • 商品

これを渡すだけで👇

👉 世界中で撮影できる


■ パターン無限生成

  • 都市
  • 夜景
  • 高級ホテル

全部、プロンプト1発。


ただし、1つだけ条件がある

ここ大事。


👉 プロンプトはGPTに書かせろ


人間が書くと、

  • 足りない
    -ズレる
    -冗長になる

GPTに任せると、

👉 “写真として成立する文章”になる


結論

今回の実験で分かったこと。


切り抜きの時代は終わった
合成の時代も終わった

これからは

「撮影を生成する時代」だ


そしてもう一つ。


FLUXは優秀な“職人”
GPT Imagesは“カメラマン”


おわりに

正直、ここまで来るとは思っていなかった。

髪の毛の切り抜きが楽になる──
その程度の話のつもりだった。

気付いたら、

「撮影そのものを置き換える話」になっていた。


これ、まだ一般には伝わっていない。

でも一度触れば分かる。


👉 戻れなくなるやつだ、これ。