普段、私は Stable Diffusion Forge + FLUX.1 を使っている。
これはこれで、かなり良いモデルだ。
特に、
- リアルな質感
- 自然な光
- 違和感の少ない人物
このあたりは、非常に優秀だ。
ただし──
今回、ちょっとした“実験”で気付いてしまった。
「これ、役割が違うな」と。
春の写真を“合成”してみた
使用したモデルの元画像

使用したプロンプト
a young woman standing under a cherry blossom avenue in spring,
soft pink sakura petals falling gently,
background heavily blurred with strong creamy bokeh,
clean separation between subject and background,
background simple and non-distracting,
subject in sharp focus, ultra sharp hair strands,
fine detailed individual hair strands visible,
high contrast edge lighting on hair,
soft rim light outlining the hair,
subtle pink light reflecting on hair,
wind gently moving her hair,
smooth realistic skin texture, natural skin tone,
photorealistic, high detail, professional photography,
85mm lens, f1.8, shallow depth of field,
studio quality lighting, soft natural sunlight,
balanced exposure, no harsh shadows,
background color contrast with subject hair,
no background distractions, no clutter
テーマはシンプル。
- 桜並木の背景
- 女性のポートレート
- 自然な合成写真
いわゆる「よくあるビジュアル」だ。
スナップという形容が似合う写真。
FLUXでやれば、簡単にそれっぽい絵は出る。
しかし実際にやってみると、違和感が出る。

問題はここだった
- F値や焦点距離が効かない
- ボケが“雰囲気”でしかない
- 細かい指示が消される(花吹雪とか)
- 全体が“無難な現実”に収束する
つまり、
「破綻しないが、意図も通らない」
GPT Imagesでやってみた結果

ここで GPT Images を使ってみた。
同じことを、同じようにやっただけだ。
結果──
- プロンプト通りに構図が変わる
- 焦点距離・F値がちゃんと効く
- 背景も含めて“写真として成立する”
- 髪、光、空気感までコントロール可能
そして何より、
「絵にドラマが乗る」
焦点距離を85mmから35mmに変えてみると、こんな感じ。

しっかり、背景のパースペクティブが変わる。
比較して分かったこと
| 項目 | FLUX | GPT Images |
|---|---|---|
| リアルさ | ◎ | ◎ |
| 指示の再現性 | △ | ◎ |
| 構図変更 | ❌ | ◎ |
| 写真文法 | △ | ◎ |
| 演出力 | △ | ◎ |
決定的だった実験

「同じ子」で、シチュエーションを変える。
- 桜並木
- 海辺
- 夜景
- 高級ホテル前
- 車と並ぶカット
これをやってみた。
結果は見ての通りだ。
👉 別人にならない
👉 構図は変わる
👉 空気感は成立する
これ、SDでやるとどうなるか
正直に言う。
地獄です。
必要なもの👇
- LoRA調整
- ControlNet
- 構図ガイド
- プロンプト微調整
- 生成ガチャ
それでも、
- 顔が崩れる
- 車が変形する
- 構図がズレる
GPT Imagesは何をしているのか
一言で言うと、
「Photoshopではなく、撮影をしている」
FLUXは
👉 “画像を作る”
GPT Imagesは
👉 “写真を撮る”
ビジネス的に何が起きるか
ここが本題。
■ ロケ撮影が不要になる
- 天候関係なし
- 場所制約なし
- スタジオ不要
■ 自社素材で展開可能
- キャンペーンガール
- 自社車両
- 商品
これを渡すだけで👇
👉 世界中で撮影できる
■ パターン無限生成
- 春
- 海
- 都市
- 夜景
- 高級ホテル
全部、プロンプト1発。
ただし、1つだけ条件がある
ここ大事。
👉 プロンプトはGPTに書かせろ
人間が書くと、
- 足りない
-ズレる
-冗長になる
GPTに任せると、
👉 “写真として成立する文章”になる
結論
今回の実験で分かったこと。
切り抜きの時代は終わった
合成の時代も終わったこれからは
「撮影を生成する時代」だ
そしてもう一つ。
FLUXは優秀な“職人”
GPT Imagesは“カメラマン”
おわりに
正直、ここまで来るとは思っていなかった。
髪の毛の切り抜きが楽になる──
その程度の話のつもりだった。
気付いたら、
「撮影そのものを置き換える話」になっていた。
これ、まだ一般には伝わっていない。
でも一度触れば分かる。
👉 戻れなくなるやつだ、これ。





