電通総研 テックブログ

電通総研が運営する技術ブログ

Stable Diffusion入門-A as Bの呪文による画像合成

電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、A as Bの呪文による画像合成の呪文です。

やまかずさんの日刊 画像生成AI (2022年9月29日)の記事で紹介されていた「A as B」は有効を今回は検証してみました。

Stable Diffusionのおすすめコンテンツはこちら。

A as Bの呪文とは

A as Bの呪文は、AをBとして描画するというものです。Aの画像にBの画像が合成されたような効果が出ます。

例えば、次のような beautiful girl as cat の呪文を試してみましょう。

今回の呪文(横長、コピー&ペースト用)

illustration of beautiful girl as cat detailed beautiful face detailed hair detailed perfect pupil of eyes detailed mouth detailed shoulders detailed bust looking far away highly detailed artstation deviantart concept art digital painting award winning fantasy scene fantasy composition fantasy lighting

閲覧用呪文(改行版)

illustration of
beautiful girl as cat
detailed beautiful face
detailed hair
detailed perfect pupil of eyes
detailed mouth
detailed shoulders
detailed bust
looking far away
highly detailed
artstation deviantart
concept art
digital painting
award winning
fantasy scene
fantasy composition
fantasy lighting

トークン出力結果(改行版) 長い呪文は切り捨てられる編参照

42 
['illustration</w>',
'of</w>',
'beautiful</w>',
'girl</w>',
'as</w>',
'cat</w>',
'detailed</w>',
'beautiful</w>',
'face</w>',
'detailed</w>',
'hair</w>',
'detailed</w>',
'perfect</w>',
'pupil</w>',
'of</w>',
'eyes</w>',
'detailed</w>',
'mouth</w>',
'detailed</w>',
'shoulders</w>',
'detailed</w>',
'bust</w>',
'looking</w>',
'far</w>',
'away</w>',
'highly</w>',
'detailed</w>',
'art', 'station</w>',
'deviantart</w>',
'concept</w>',
'art</w>',
'digital</w>',
'painting</w>',
'award</w>',
'winning</w>',
'fantasy</w>',
'scene</w>',
'fantasy</w>',
'composition</w>',
'fantasy</w>',
'lighting</w>']

画像出力結果

実は、この結果は、50回試して一回出るくらいの奇跡的な画像です。Aを人間、Bを動物にした場合、動物が耳に特徴があると、3, 4回に一回くらい、耳だけが人間に取り込まれます。

Bが犬など、耳にそれほど特徴がない場合、BがAに取り込まれる可能性がかなり減ります。

まとめ

A as Bは、再現性が低いですが、うまくいくと面白い画像が作成できると言ったところでしょうか。

次回は、かわいい動物の擬人化編です。

仲間募集

私たちは同じグループで共に働いていただける仲間を募集しています。
現在、以下のような職種を募集しています。

Stable Diffusionの過去コンテンツ

執筆:@higaShodoで執筆されました