2023年はAI利用が社会に広く浸透した最初の年といえます。既にさまざまなAIサービスが開始されています。
Microsoft Bing AI もそのひとつです。GPT-4 が採用されていることでも話題になりました。Bing AIでは文字から画像を生成できる「Bing Image Creator(ビング・イメージ・クリエーター)」というサービスもあり、今では日本語の単語や文章を入力するだけで画像が生成されるようになっています。
先日、Bing Image Creator は OpenAI の「DALL-E 3 (ダリ・スリー)」が採用されたことによって大きな進化を遂げました。これまでとは比べものにならないほど高精細な画像の生成が可能になっています。しかも、生成に掛かる時間はかなり短いです。これは本当にすごいのでAI画像生成を試したことのない方はぜひ一度試してみてください。
この Bing Image Creator は「Stable Diffusion(ステーブル・ディフュージョン)」によるAI画像生成と比べて、事前の準備と細かい設定が一切不要で誰でも簡単に利用することができます。Bing AI の登録と Bing Image Creator の利用方法は以下のページに詳しく記載されています。
Bing Image Creator によるAI画像生成が超高画質に!
初期の頃と比べて驚くほどの変化
このページでは、Bing Image Creator が初期バージョンからどの程度良くなっているかについて、同一のプロンプトで生成した画像の比較を通してその進化を紹介しています。
まったく同じプロンプトで生成した古い画像(2023年3月頃に生成したもの)を左側、新しい画像(同年10月2日頃に生成したもの)を右側に提示しています。生成に用いたプロンプトも併せて紹介しています。
最初のほうのサンプルは英語のプロンプトになっていますが、それは以前のものと比較するためです。途中から日本語のプロンプトの生成例も紹介しています。
バイク&サイバーパンク1
anime, 1 woman, ponytail, black hair, rider suit, ride a motorbike, cyberpunk, Tokyo
サイバーパンクの世界観において、ライダースーツに身を包んだ女性がバイクにまたがっているカッコイイ画像を生成しようと試みたものです。
AI画像生成を試したことのある方にはお分かりいただけると思いますが、キャラクターだけでなくバイクのディティールも以前と比べて大きく改善されています。バイクの画像を生成するとハンドルグリップやブレーキレバー、ステップ等がめちゃくちゃになることが多いのですが、かなり上手く描いてくれるようになっています。それに加えてライダースーツもサイバーパンク感が増しています。
バイク&サイバーパンク2
anime, 1 woman, ponytail, black hair, red eyes, looking at viewer, rider suit, ride a motorbike, cyberpunk, Tokyo
先ほどと同じくサイバーパンクを意識しています。こちらの画像は「red eyes(赤い目)」「looking at viewer(こちらを見ている)」という言葉を付け加えています。
同じプロンプトで画像の生成を繰り返すと全体が描かれたり背景がしっかり描かれたりすることもあります。ブーストポンインを考慮しながら生成を何度か試したいですね。
コンピュータ&SF1(実写)
high quality, secret base, indoors, 1 woman, many computers, many monitors, many cables, messy, SF
最初の頃は人物が綺麗に描かれないことが多かったのですが、今では人物もしっかりと描かれるようになっています。モニターは整然としており画面も細かく描き込まれていることが分かります。
なお、古い画像の方は人物が割と上手く描かれているものをピックアップしています。最新版では顔がはっきりと描かれたものを生成することも可能です。
コンピュータ&SF2(アニメ)
high quality, anime, secret base, 1 woman, computers, many monitors, many cables, messy, SF
先ほどの画像をアニメ調にしたものです。古い方は味があるといえばそうかもしれません。ですが、新しいほうがキャラクターもコンピュータも描き込みが細かくなっています。
同じプロンプトで生成を繰り返してもキャラクターが問題なく描かれていることが多いです。
部屋でギターを弾いている女性
high quality, anime, studio, indoors, 1 woman, play a guitar, amp, cables, many effectors, messy
最新版ではやはり人物がしっかり描かれるようになっています。エフェクターやシールドなどもクリアに描かれていますね。
剣と鎧のファンタジー
anime, best quality, detailed, 1 woman, ponytail, blonde hair, fighter, armor, sword, shield, old castle, fantasy
剣と鎧のファンタジー世界は個人的にかなり好みなので、以前から画像をたくさん生成していました。左右の画像を比較するとクオリティーが天と地ほども違っています。
かつては武器の形状や持ち方がおかしいことが多かったのですが、そのあたりも随分改善されていて違和感の少ない画像が容易に生成されるようになっています。
新旧バージョンの画像を比較すればその差は一目瞭然
Bing AI でAI画像生成ができるようになったのは2023年の3月末頃からということを考えると画像生成の品質が短期間で飛躍的に向上しているといえます。AI関連技術は進化のスピードが尋常ではありません。
2023年の4月末頃からはプロンプトの日本語入力にも対応しています。以上の比較画像は日本語入力に対応していない頃の画像との比較ということもあって、プロンプトが英語(英単語)のままになっていますが、日本語入力でも同じような画像を生成することが可能です。
しかも最近では日本語の文章に対する理解力も想像以上に高く、言葉で表現したものを上手く汲み取って画像を生成してくれるようになっています。プロンプトはシンプルな単語の羅列でもそれなりの文章でも問題ありません。このことは以前にも増してAI画像生成の利用が容易になったことを意味しています。
それでは実際に日本語のプロンプトを入力して生成された画像を見てみましょう。
日本語のプロンプトでも美麗な画像の生成が可能
日本語プロンプトによる画像の生成例
アニメのような画像を希望する場合は「アニメ調」や「アニメーション」などの言葉を加えて、実写のような画像を希望する場合は「実写」や「写真」などの言葉を加えます。
記述は単語と単語を「、(読点)」や「,(カンマ)」で区切っても「 (スペース)」で区切っても構いません。
実際には存在しないものをプロンプトとして入力することもできます。ただし、想像通りのイラストが生成されるとは限りません。
以下の生成例とそのプロンプトを見てみてください。プロンプトをそのままコピペしてお試しください。
柴犬のお散歩
柴犬を散歩させる女性 河川敷 アニメ調
このように日本語の簡単な文章や単語を入れるだけでも素敵なイラストを生成することができます。こういう画像はカレンダーのイラストになっていてもおかしくありません。
ミカンを食べながらの団らん
こたつでミカンを食べながらテレビを見る老夫婦 アニメ調
このようなほっこりする画像も生成することができます。ただし、「こたつ」はなかなか上手く表現されませんでした。また、みかんを皮のまま囓っている画像がでてくることもあります。
複数人を表現すること自体は難しくありませんが、4人5人と登場させると端にいるキャラクターの描写がおかしくなることが多い印象を受けます。
海辺で花火を鑑賞する
海辺で花火を鑑賞する老夫婦 アニメ調
こちらは花火を鑑賞している夫婦を背後から捉えた画像ですが、生成を繰り返すと横向きなども生成されます。
プロンプトを工夫することで花火や夜空のリアリティを高めることも可能です。
バイクにまたがる若者
バイクに乗る若い男性 革ジャン ジーンズ アニメ調
悪ぶっているけど実は優しい男子?でしょうか。イケメンの画像もたくさん生成できます。服装の指定も構図にも寄りますがしっかりと反映されます。
バイクの色や風景を追加で指定するのもありです。
赤いスポーツカーに乗る青年
赤いスポーツカーに乗る若い男性 黒いジャケット アニメ調
車やバイクの表現はなかなか難しいようですが、それでも以前と比べると驚くほど良くなっています。
ボンネットに腰掛けていることもあれば、車全体が表現されることもあります。
黄色いスポーツカーに乗る男
黄色いスポーツカーに乗る長髪の男性 黒いジャケット サイバーパンク アニメ調
ちょっと悪っぽい男が出てきました。ハンドルは右にあるのでしょうか……。
赤いバイクで夜を駆ける
赤いバイクに乗る銀髪の男性 夜 サイバーパンク アニメ調
赤いバイクはとても格好いいですね。ドゥカティのような MVアグスタのようなスズキのような……。いずれにしても躍動感があります。
パッと見た感じでは大きな違和感はありません。以前はハンドルがないといったことも普通にありました。
百戦錬磨の老戦士
鎧を身に纏って剣を振り上げる老年の騎士 アニメ調
険しい顔つきと無骨さに強者感が漂っています。こういうのは個人的に好みです。
このようなシンプルなプロンプトではヘルメットを被っている(顔が見えない)ことも多々あります。また、「老年」のような表現を加えるとほとんどの場合に髪が白髪/銀髪になります。
箒で星空を駆ける少女
箒にまたがって星空を飛ぶスカートの女の子 ファンタジーアニメテイスト
こういう綺麗なイラストも素敵ですね。
箒にきちんとまたがってもらうためには画像を何枚か生成する必要があります。
剣を持って佇む騎士
鎧を身に纏って剣を持つ女性 白いドレススカート 実写 写真
もちろん、実写のような画像も生成することができます。ファンタジー映画のワンシーンのようです。
実写調はアニメ調と比べると手に問題を抱えていることがやや多い印象ですが、それでも以前と比べると自然なものがとても多いといえます。
赤いドレスを着た女性
赤いドレスを着た女性 フリル 実写 写真
海外のファッション雑誌の表紙みたいですね。実際の写真と言われても分かりません。
白いドレスを着た女性
白いドレスを着た女性 フレアスカート 実写 写真
このように人物が全体像として表現されることもあります。
通常の画像生成では4枚の画像が出力されます。ポーズを指定していなければ立ち姿になります。登場人物を座らせたい場合は「椅子に座っている」といった表現を付け加えてみてください。
画像の修正
生成した画像に少々の問題があっても、ウェブ上の「Lama Cleaner」を使うだけで自動的に修正することが可能です。ペイントソフトが使える方はそちらで修正するのもよいかもしれません。
Bing image Creator を実際に試してみよう
プロンプトの基本
各種プロンプトは以下のページが参考になります。好みの画像を生成するためのヒントがあります。望んだシーンが表現できる言葉を見つけてプロンプト欄に入力してみてください。
これらのページは元々「Stable Diffusion web UI」というパソコン内でAI画像生成を行うためのプロンプト集ですが、Bing Image Creator を利用する際にも辞書的に活用することができます。適当な表現をコピペしてプロンプト欄に英語または日本語で入力してみてください。
Bing image Creator の利用方法
OpenAI の DALL-E 3 が採用された新しい Bing Image Creator は以前とは比べものにならないほど美麗なイラストを生成することができるようになっています。
Microsoft Bing のアカウントを取得すれば現在のところ無料で誰でも簡単に画像を生成することができます。高価なパソコンも高性能なグラフィックボードも必要ありません。ぜひ一度試してみてくださいね。
詳しい手順は以下のページをご覧ください。