特集 2023年6月9日

写真をAIに文章で説明してもらう→それをもとにまた画像を作る→外国になる

極限まで単純な画像ならどうか?

どれだけ変換を続けても変わらないような画像はないだろうか。

たとえば、ものすごく単純な画像ならずっと変わらないままだったりしないだろうか? というわけで、「白い背景に赤い正方形」というすごく単純な状況から始めてみることにする。

単純な赤い正方形。これならどうか。

真っ白な背景に真っ赤な正方形というシンプルでモダニズムな構図で描かれています。正方形はフレーム全体を支配しており、その縁は滑らかな背景に対して明確に描かれている。

(※まさにそのとおり。いい調子!)

全然違う!「真っ白な背景に真っ赤な正方形」って言ったのに。

 ↓

部屋は白い壁と白い床で構成されたシンプルなものです。部屋の中央には、鮮やかな赤い四角が置かれ、フォーカルポイントとなっています。

どこかの部屋ということになったらしい

画像は、白い壁と大胆な赤のアクセントウォールを持つ子供部屋を描いています。部屋の片隅には木製の椅子が置かれています。赤と緑の大きなドアがあり、その内側にはガラス窓と鏡があります。

最終的に子供部屋になった

 

四角い赤のまま変わらない、ということを目論んでいたが、そうはならかった。このへんでやめておこう。少なくとも図として単純な状況ならそのまま収束する、ということはなさそうだ。

いったん広告です

人間がプロンプトに指示されて写真を撮る

最後は趣向を変えて、AIが生成した文章をもとに自分で写真を撮ってみたらどうなるか、というのをやってみたい。

たとえば「カメラは男性と看板に焦点を合わせ、その他の背景はぼかしとピンボケのままである」と書かれていたら、なるべくそのとおりに写真を撮ってみるのだ。そしてAIの生成した画像と比べてみたい。

冒頭の税務署の例でやってみよう。


画像は、緑のジャケットと白いシャツを着て駅前に立つ男性を捉えたものです。カメラは男性と看板に焦点を合わせ、その他の背景はぼかしとピンボケのままである。

↓文章をもとに写真を撮影

税務署から葉書が届いた

 

続けてやってみる。

 

夜の都会で、緑のジャケットを着た男が駅の外に立ち、上を見つめている。駅前は深夜にもかかわらず賑やかで、画面のあちこちに人の気配が感じられる。

お酒でも飲むか

 

スーツ姿で背筋を伸ばし、ダイナミックにきらめく都会の夜景を眺める男性。手前には男性の顔の左側が写り、耳とあごが強調されています。

明日は休もう

 

どうだろうか。同じ文章を元にAIの生成した画像と比べてみよう。

画像は、緑のジャケットと白いシャツを着て駅前に立つ男性を捉えたものです。
夜の都会で、緑のジャケットを着た男が駅の外に立ち、上を見つめている
スーツ姿で背筋を伸ばし、ダイナミックにきらめく都会の夜景を眺める男性。

AIのほうが明らかにダイナミックでかっこいい。が、それよりも、自分の写真を別の人の解釈をもとに撮り直す、という体験がなかなか楽しかった。

ツールについて

本記事では、文章から画像を生成するために Image Creator from Microsoft Bing を利用しました。左下に「b」のロゴが載っている画像はすべて同ツールで生成されたものです。

また、画像から文章を生成するために SceneXplain を利用しています。

実際の入力と出力はいずれも英文ですが、記事内では DeepL によって日本語に訳したものを記載しました。


まとめ

再現なく変わり続けるか、それとも収束するか、というのがもともとの興味だった。それでいうと、おそらく変わり続けるんだろうと思った。

傾向としては、数回は似たような画像が続いた後、ちょっと趣向が変わってまた似たような画像が続くように思った。ツール単体としても同じ入力に対して毎回同じ出力を返すわけではない揺らぎがあり、他のツールとのやりとりで生じる揺らぎもあるのだろう。

<もどる ▽デイリーポータルZトップへ

banner.jpg

 

デイリーポータルZのTwitterをフォローすると、あなたのタイムラインに「役には立たないけどなんかいい情報」がとどきます!

→→→  ←←←

 

デイリーポータルZは、Amazonアソシエイト・プログラムに参加しています。

デイリーポータルZを

 

バックナンバー

バックナンバー

▲デイリーポータルZトップへ バックナンバーいちらんへ