chatGPT/AIWindows関連

Windows11 CopilotでDALL-E3画像処理3パターンについて検証!

Microsoftは2023年10月3日に、画像生成AI「DALL-E 3」が「Bing Chat」(Windows Copilotのチャット機能)と「Bing Image Creator」で使用可能になったと発表されました。OpenAIの最新で最も高性能なテキストから画像への変換モデルが、誰でも無料で利用できるようになったと!

「DALL-E 3」は、今年の9月に公開された最新の画像生成AIモデル。

ユーザーは自分の言葉を視覚的な表現に変換する力を手に入れることができます。これは、AIの可能性をさらに広げる一歩と言えるでしょう。

そこで今回はWindows11 Copilotのチャット機能(Bing Chat)から画像処理でどんなことができるのか検証してみることにしました。

検証の前にBing ChatからDALL-E3モデルを使って画像生成するのは無限にできるのか。
全て無償なのか。
その辺りについて整理することにしました。

画像生成(DALL-E3)は全て無料で無限に生成できるの?

チャットから画像生成に関する質問(プロンプト)を投げると画像生成してくれますが、
果たしてこれはどこまで無料なのか。無限に生成できるのか。この辺りを整理していきます。

画像生成は無料でできる?

結論としては無料で何回でも使えます!
正し高速に生成してくれる回数には制限もあるため、
無料のまま1日に数百数千もの画像を生成することは困難です。

Q. Image Creatorを使用するためのキャンセル待ちリストはありますか?

キャンセル待ちや費用はありません。 Googleは、AIで生成された画像をすべての人が利用できるようにすることに取り組んでいます。そのため、Microsoftアカウントを持っている人ならだれでも自分のアイデアを画像に変換できます。

引用:Bing Image Creator(Microsoft公式)

少しややこしいですがWindows Copilotのチャット機能はBing Chatで画像処理に関する質問(プロンプト)を投げるとBIng Image Creator(画像生成AIのモデルはDALL-E3)を呼び出し生成する流れとなります。

そのため上記の内容からすると無料であるのは間違いなさそうですね!

無限に画像生成できる?1日に生成可能な数に制限は?

結論として制限は無いが高速生成可能なのはブーストの回数分となる。
※ブーストが不足時は生成に5分程度かかる

Microsoft_Image_Creator_ブースト数リワード数

画像生成が高速に行える回数とはブーストの数で決定します。(数の確認はImage CreatorサイトでMicrosoftアカウントにログインした状態で確認できます)

1回のプロンプトからの指示でブーストが1つ減るため、
上記画像では99回画像を高速に生成することが可能。

2023/10時点でのブースト最大数は99で1日毎に一定数付与されます。

またブーストが不足した場合はリワード(Microsoftのポイントサービス)で追加可能です。

ブーストが不足した状態で画像生成すると5分程度時間がかかりますが画像のクオリティには影響なし!

画像生成は無料である程度の回数であればストレスなく生成してくれることが分かって安心ですね!

ではいよいよ検証してみることにしました。

Windows Copilotで可能な画像関連の機能は3パターン

画像関連機能説明
画像生成特定のプロンプトに基づいてAIモデルがグラフィカルなアートワークを生成します。例えば、「ドラゴンの絵を描いて」というリクエストに対して、AIはドラゴンの絵を生成します。
画像説明ユーザーが送信した画像の説明を提供します。これは、画像内の情報を理解し、それに基づいて適切な応答を生成するために使用されます。
画像検索特定のキーワードやフレーズに基づいてWebから画像を検索します。これは、特定の情報や質問に対する応答を補完するために使用されます。
画像からテキスト抽出現在、Bing Chatは画像からテキストを抽出する機能を持っていません。

最近では様々な画像処理機能でテキスト抽出機能は可能ですが、
Bing Chatではまだその機能は実装されていないようです。

画像生成

色々な画像生成のパターンを試してみます!
まずはスポーツ系の写真から

サッカーのボレーシュートの写真生成

# プロンプト
プロのサッカー選手が豪快にダイレクトボレーシュートを蹴っている写真を躍動感が伝わるように書いて

microsoft_image_creator_soccer

チャットから指示して数秒後には生成された画像がチャット画面内に表示されました。

画像をクリックするとEdgeブラウザが立ち上がり左側の画像が表示されます。

全体的に概ね伝わりはしますがちょっとこれは・・・躍動感はありますが、
もう少し指示を細かく出す必要がありそうですね。

クリスマスの東京タワー

# プロンプト
クリスマスの夜に雪が降っている情景で東京タワーのイルミネーションが輝いている写真を生成して

dall-e3_東京タワー1 dall-e3_東京タワー3 dall-e3_東京タワー2

少しイラストっぽい感じではありますが、
イメージ写真やイラストとして使えそうな素材になりそうです!

プードルが芝生の上を走っている

# プロンプト
かわいいプードルが芝生の上を走っているイラストを描いて
dall-e3_プードル dall-e3_プードル2 dall-e3_プードル3 dall-e3_プードル4
これはもう・・・可愛すぎるwww

3DのKAWSシリーズのキャラクター

最後はクオリティ高めのものを期待して以下サイトからプロンプトを引用させていただきました。

DALL·E Prompt : “3d render” – DALL·E Wizard (dallewizard.com)

# プロンプト
3Dレンダリングシンプルな最小限のおもちゃアートkawsかわいい漫画の太ったシーズーの吠え声のスタイル、現代のミニマリスト
dall-e3_3Dキャラクター
KAWSっぽい雰囲気がでてますね!

画像説明

画像説明はチャット内に画像を添付して画像の説明を聞くことが可能です。

AI生成された画像について聞いてみた

まずは無茶なお題から試してみます。
先ほどAIで生成したKAWS似の3Dキャラクターの元となったアーティストを聞いてみました。

windows_copilot_画像説明1

求めた回答としてはKAWSでしたが、そもそもAIで生成した画像と予測した所まではあっていましたね!

ただグラドルなんって予測はちょっと残念でした。

Windowsのデスクトップ画面の説明を聞いてみた

windows_copilot_画像説明2

# 回答
この画像は、Windowsのデスクトップのスクリーンショットです。以下のような特徴があります。

  • 壁紙は青い抽象的な花のような形をした3Dレンダリングです。多くの層と折り目があります。
  • 画面の右側には、日本語で書かれた黄色い付箋があります。
  • 付箋のタイトルは「PRO Copilot」となっており、指示やタスクのリストがあります。
  • タスクバーには、Windowsのロゴ、フォルダ、ウェブブラウザなどのアイコンがいくつかあります。
  • タスクバーの右下には時刻と日付が表示されています。

他に何かお手伝いできることはありますか?

おおお!

これは素晴らしい回答ですね!
デスクトップの壁紙の説明からCopilotのテキストまで認識しています。
テキスト抽出は難しいとのことでしたがしっかり説明することはできるんですね!

 

花の名前を聞いてみた

ユリの花画像認識確認

引用:花かぎけん花図鑑

windows_copilot_画像説明3

大正解としてはアジアンティック・・・でしたが大分類?としてユリの回答は半分正解と言ってよいでしょう。

画像検索

windows_copilot_画像検索

これは期待通りの結果ですね!

Edgeブラウザで検索した情報を抽出してきてくれました!
画像をクリックするとEdgeブラウザの画像検索画面に繊維するので「Edgeを開く→画像検索をクリック→検索文字入力」の動作よりWindows Copilotのチャット機能から呼び出す方が効率的な印象です。

 

画像の説明(Bing Chat機能) → 画像生成(DALL-E3)が優秀!

これは画像生成用のプロンプトを作成するのが面倒な方向けです。

画像の説明については色々検証してみましたが、
最もインパクトの高い活用方法として画像生成したい画像に近い画像の説明をCopilot(Bing Chat)で聞く→教えて貰った画像説明のまま画像生成をお願いすると、
想像の斜め上を行く画像を生成してくれます(笑)

一例として「スマートシティ」のイラストを素材見本としてオリジナルを描いてもらいました。

①描いて欲しい画像をピックアップ

引用:フリー素材「ソコスト」

引用:フリー素材「ソコスト」

②Copilotに画像の説明を聞く

Windows_in_Copilot_画像説明

この画像は、様々な建物や乗り物が描かれた都市風景のイラストです。建物には高層オフィスビル、病院、工場、風力発電所などがあります。乗り物にはバス、車、ドローンなどがあります。イラストはシンプルでフラットなスタイルで、細部はあまり描かれていません。色彩は青、緑、灰色に限られています。このイラストは現代の都市生活の様子を表現していると思われます。
③Copilotに画像生成依頼
プロンプト
以下の内容のイラストを描いて 様々な建物や乗り物が描かれた都市風景のイラストです。建物には高層オフィスビル、病院、工場、風力発電所などがあります。乗り物にはバス、車、ドローンなどがあります。イラストはシンプルでフラットなスタイルで、細部はあまり描かれていません。色彩は青、緑、灰色に限られています。このイラストは現代の都市生活の様子を表現していると思われます。
Windows_in_Copilot_DALL-E3
もう少しタッチを変えてと修正の依頼をすることも可能。
Windows_in_Copilot_DALL-E3_city

画像からテキスト抽出

これは残念ながら抽出することができないとBing Chatからも回答がありました。

今後のアップデートに期待したいですね!

画像/テキスト関連ですと、
画像の中にテキストを指定することでテキスト入りの画像を生成することも可能です。

ただ、英語は生成できたことは確認できましたが「日本語」は複雑なこともあり難しいようです。

Windows Copilotの画像処理(Microsoft Image Creator DALL-E3)の今後に期待

現時点でも様々な機能が使えることができ非常に期待できる内容でした。

精度としてまだまだ期待してしまう面はありますが、
Widowsのデスクトップ画面からチャット操作でこれだけ画像関連の処理ができると、
タスクの効率化やイメージ画像やフリー素材を探さずにサクッと生成してしまうことで目的を達成してしまうことを考えると非常に魅力的です。

まだまだ使いこなせていないのでこれからどんどん使ってくことで、
より便利な活用方法については今後も共有していきます。

コメント