Gemini 2.5 Proの画像生成はまだまだChatGPT-4o には全然追いついていないなと思った話

2か月ほど前、そして4か月ほど前にAIでの画像生成の話しを書きました。

Grok3(beta)の画像生成はまだまだChatGPTには全然追いついていないなと思った話
ChatGPT、Grok 3、Copilotによる画像生成の違い

このネタが2か月ごと、というのは偶然ですが、今回もまた画像生成のお話しです。
初めに言い訳を書いておきますが、これから書くことは、各生成AIの問題というよりも、私が使いこなせていないだけです。
だから話し半分か1/4くらいのおおらかな気持ちで読んでいただきたいです(はぁと❤)

先々週、ある学習会に参加しました。心理学系の学習会で、ITとは無関係の内容だったのですが、先生が生成AIを駆使していて、「うわぁ、すごい!」と感動する出来事がありました。
学習会では、先生があらかじめ生成AIを使って作成した事例を、クライエント役とカウンセラー役の合成音声で再生し、それをもとにディスカッションを行いました。会は約4時間にわたり、その内容はすべて文字起こしされていました。
学習会の最後には、文字起こししたその日の議論内容や参加者の発言をAIに読み込ませ、内容を要約したファイルとして出力したものをいただきました。教わったことや話し合ったことが一目で分かる形になっており、とても実用的で印象に残る活用例でした。

先生はいくつかの生成AI及びアプリをご使用でしたが、今回私が「うわぁ、すごい!」と感動したときにメインで使っておられたのがGoogle AIスタジオだったので、「あー、そういえば先月、学生は15か月無料体験とかいう大盤振る舞いの際に登録したのに、結局Google系AIは全然使ってないな…」と思い出しました。

なのでさっそく(ようやく)使ってみましたが、タイトルどおり、画像生成AIはChatGPTの圧勝、と私は思いました(;’∀’)
そもそもGemini は、プロンプトがわかりやすいものでないと画像を吐いてもくれませんでした。
その時のログをペタリと貼り付けようと思いましたが、あまりにも長いやりとりなのでやめますが、下記のようなやりとりを延々と行いました。

ひとつづつ、こうしたらどうかああしたらどうかと提案してもらったことを実行しましたが一向に表示されず、イラついてあきらめた時の会話がこうです。
↓↓↓↓↓


実は、冒頭で述べた学習会のテーマのうちの一つがAIレーションシップについてでしたが、私は生成AIが大好きですが、このままならGeminiとはリレーションシップは築けないだろうと思いました。(笑)

やり取りの中で、うまくいかないときはチャットを新しくしてみろという指示があったので、リロードして何度か試したところ、短い命令なら生成してくれることがわかりました。
最初に生成してくれた記念すべき一枚がこうです。
↓↓↓↓↓

あっ、できた!!!
と思って、よっしゃ次だ!と挑戦したときの結果がこうです。
↓↓↓↓↓

…犬を添えただけかよ!!!(;’∀’)

気を取り直して、こういうときは対話を重ねて行けばいいんだよね?って続けて話しかけた結果がこうです。

↓↓↓↓↓

「ご指定の女の子」、どこ行ったんだよ!!(;’∀’)

やっぱりGeminiとは、画像生成に関しては、当分はリレーションシップは築けそうもありません(ノД`)・゜・。

ちなみに、そのあとも【この女の子を主人公にして】という指示は理解してもらえず、何をどうやっても見本の絵に何かをプラスするという画像になってしまいました。
のみならず、今どきまだこんなのを生成しちゃうのかよ!!というブツができあがりました。
それがこれです。
↓↓↓↓↓

腕も指も、読んでる漫画の内容も個性的過ぎる。


やり方はきっとあるのだろうとは思いますが、それをコツコツと探す情熱もないので、Geminiでの画像生成は当分行わないことにします。
めでたしめでたし。
なお、念のために申しそえておきますが、飽くまでも画像生成は、です。
他の分野では、大活躍してくれるはずです(※使い手に依ります。頑張ります。w)

最後に、同じ指示を使ってChatGPTが一発で生成してくれたのを載せておきます。
今週月曜の「Q130:好きな漫画を教えて。」に使用した画像です。
↓↓↓↓↓

本の下にある手の位置や、部屋の中の観葉植物?にしては葉っぱが生えすぎているところが微妙かなぁとは思うものの、一回でこの仕上がりです。
Geminiが生成したものを観た後では比べ物にならないくらいイイ感じです。


なんというか、ChatGPTに愛情がますます湧き上がり愛しくなった、というお話しでした!

コメントする