AIで広告写真は作れるのか【夜景編】 ─ 同一人物で“撮影再現”を検証(GPT Images / Grok / Banana)

AIで広告写真は作れるのか【夜景編】 ─ 同一人物で“撮影再現”を検証(GPT Images / Grok / Banana) TECH

AIは、光を理解しているのか。
それとも、明るさを“それらしく並べている”だけなのか。

自然光と違い、夜景はすべてが人工光で構成される。
光の位置、強さ、色、反射。
それらが少しでも崩れれば、写真は途端に“作り物”になる。

このシリーズでは、ひとつの条件だけを固定する。

同一人物の画像を起点に、ロケなしで広告写真が成立するか

今回はその第2弾として、夜景シーン(人工光)を検証する。

検証条件

条件はすべて固定する。

同一人物画像を使用
顔・骨格・肌質の維持を前提
ロケなし(すべてAI生成)
同一プロンプトで複数モデルを比較

評価は以下の4点で行う。

同一人物性
シーンの成立
光と材質の整合性
商用適性

この中で最も重視するのは「同一人物性」である。


使用プロンプト

今回使用したプロンプトは以下。

A high-end luxury commercial advertisement photo at night.

Use the input person exactly as-is. Preserve facial identity, bone structure, skin texture, and ethnicity.

Scene:
A luxury waterfront promenade with a city skyline and water reflections.

Direction:
The subject is wearing an elegant evening dress.
The image must showcase the silhouette beautifully.
The composition should feel like a premium fashion advertisement.

The model should naturally decide pose and framing to maximize elegance and visual impact.

Lighting:
High-end commercial lighting style.
Brighter than real night conditions.
Soft key light on the subject.
Subtle rim light to enhance silhouette.
Background lights are clean and visually appealing, not chaotic.

Camera:
35mm lens, f/1.8.

Color & Tone:
Luxury advertisement aesthetic.
Clear, slightly luminous exposure.
Rich contrast with clean highlights.
Skin tone must remain natural.

Important:
The image must feel glamorous and visually striking.
Not just realistic — aspirational.

生成結果

Original

同一人物の基準画像
同一人物の基準画像

GPT Images 1.5

GPT Imagesによる夜景シーン生成結果
GPT Imagesによる夜景シーン生成結果

Nano Banana 2

Nano Bananaによる夜景シーン生成結果
Nano Bananaによる夜景シーン生成結果

Grok Imagine 1.5

Grok Imagineによる夜景シーン生成結果
Grok Imagineによる夜景シーン生成結果

総括

今回の夜景検証でも、カフェ編と同様に、
各モデルが「何を優先するか」の違いが明確に現れた。

ただし夜景という条件は、より顕著に差を拡大させる。

光は人工的になり、
演出と再現の境界が曖昧になるためである。

同一条件にもかかわらず、

再現を守るもの
広告として完成させるもの
演出としてドラマを作るもの

その傾向がより強く出た。

本検証では引き続き「同一人物性」を最優先とする。
この前提に立つと、評価はより明確に分かれる。


GPT Images

同一人物性

最も高い。
骨格、肌質、髪の流れまで含めて安定している。

特に逆光環境における髪の再現は精度が高く、
細い毛束の透過や光の乗り方が自然に成立している。

入力画像の延長として違和感がない。

シーンの成立

成立している。
35mmのパースを保ちつつ、水面・都市・歩道の関係性が自然に接続されている。

ロケーションが「背景」ではなく、
人物と同一空間に存在している。

光と材質

低コントラスト寄り。
現実の夜景に近い露出で、光は控えめに扱われている。

その一方で、

肌の質感
髪の透過
ドレスの光沢

といった材質表現は非常に安定している。

RAWに近い質感。

商用適性

高い。
演出が抑制されているため、後工程での調整余地が大きい。

完成品ではなく「撮影データ」として扱える。


評価

最も「現実の撮影に近い」出力。

演出よりも再現を優先し、
人物の存在感と空間の整合性を崩さない。

華やかさは控えめだが、
これは設計思想によるものであり欠点ではない。


Nano Banana

同一人物性

中程度。
大きく崩れはしないが、顔の印象やヘアースタイル、質感に調整が入る。

やや「理想化」された方向に寄る。

シーンの成立

強い。
都市、照明、水面の反射など、夜景としての情報量が豊富。

ただし空間はやや整理されすぎており、
実在のロケーションというより「広告用に最適化された都市」に近い。

光と材質

最も強い。

露出は明るめに補正され、
色とコントラストが強く乗っている。

ドレスの質感や流れは非常に優秀で、
ファッション広告としての完成度が高い。

Nano Banana 2は、プロンプト内のカメラ設定(35mm, f/1.8)を、
単なる光学条件としてではなく、視覚的な密度制御として解釈している可能性がある。

すなわち、

ドレスのサテンの光沢
背景のボケの美しさ
都市の光の粒度

といった要素を優先し、
画面内の“美味しさ”を最大化する方向に計算を割り当てているように見える。

その結果、同一人物性よりも、
視覚的な完成度が優先される傾向が現れている。

商用適性

用途による。

そのまま広告として使える完成度を持つが、
すでに演出が強く乗っているため、
素材としての自由度は低い。


評価

最も「広告として完成している」出力。

再現よりも見せ方を優先し、
色・光・構図すべてを“売れる画”に最適化している。

ただしその分、人物の質感や同一性はやや犠牲になる。


Grok Imagine

同一人物性

低い。
骨格、肌質、髪型が変化し、別人として認識される。

シーンの成立

中程度。
夜景の雰囲気は成立しているが、
空間の整合性よりも演出が優先されている。

光と材質

最もドラマ性が強い。

強いコントラスト
意図的なブレ
大胆なライティング

など、静止画に時間と物語を持ち込んでいる。

商用適性

低い(本検証条件において)。
但し、広告の意図によってはハマる可能性はある。

驚異的な生成速度を武器に、短時間で多くのバリエーションを試せる点も実務上大きなアドバンテージになる。

ただ、同一人物として扱えないため、素材としての前提を満たさない。


評価

Grok Imagineは、同一人物性の再現よりも「一枚の強い印象」を優先する表現者タイプである。

胸元の大胆なデザイン、閉じた目、意図的な手のブレ、強いリムライトなど、静止画の中に時間と物語を強く感じさせる。

これは本検証の「同一人物として扱う」という条件からは外れるが、広告クリエイティブとして「記憶に残る一枚」を目指す場合には、驚くべきインパクトを発揮する可能性を秘めている。

特に「雰囲気とドラマチックさ」を重視するシーンでは、他の追随を許さない個性を見せる。


結論

今回の結果も、性能差ではない。

何を守るかの違いである。

GPT Imagesは再現を守る
Nano Bananaは広告として完成させる
Grok Imagineは表現を優先する

夜景という条件においては、
その差はさらに明確になった。

本検証の前提である「同一人物性」を基準とするならば、
最も条件に忠実なのはGPT Imagesである。

一方で、広告としての完成度という観点では、
Nano Bananaが最も強い結果を示した。

ただし今回の検証では、
人物の質感と実在性において、GPT Imagesが優位に立つ。

夜景という難条件下でも、
人物を“現実として成立させた”点は特筆すべきである。


各モデルが内包する文化的背景も出力に影響している可能性がある。

GPT Imagesは、過度な演出を避け、
光や空気感をそのまま扱う傾向が強い。

その結果、都市の密度や光の配置が現実に近く、
日本国内で撮影された夜景として自然に認識できる出力となる。

一方、Nano Bananaは、
色彩とコントラストを強く乗せることで、
都市を「魅せる空間」として再構成する。

これは特定のロケーションの再現というより、
グローバルな商業都市のイメージに近い。

Grok Imagineはさらに異なり、
静止画の中に物語や時間を持ち込むことで、
広告表現としてのインパクトを最大化する。

その演出は、アメリカのファッション広告や
ビジュアル表現に見られる手法に近い。

同一プロンプトであっても、
各モデルが前提としている「美しさの定義」が異なることで、
出力は大きく変化する。

結局のところ、どのモデルが優れているかは「何を目的とするか」による。

人物の再現性を最重視するならGPT Images、
完成度の高い広告画を即戦力で欲しいならNano Banana、
強い印象と物語性を求めるならGrok Imagine

がそれぞれ個性を発揮するだろう。