トップへ

Google、「Gemini」の画像生成機能を「Imagen 3」に 人物描画も“間もなく”

2024年08月29日 09:51  ITmedia NEWS

ITmedia NEWS

「太陽の光が差し込む草原で卵からかえった小さなドラゴンと、その周囲を光る好奇心旺盛なチョウが取り囲むアニメタッチの画像。鮮やかな色彩で、鱗は詳細に」というプロンプトで生成された画像例(画像:Google)

 米Googleは8月28日(現地時間)、「Gemini」の画像生成機能に最新の画像生成モデル「Imagen 3」を導入すると発表した。無料版を含むすべてのGeminiで、日本語を含むすべての言語のユーザーが利用できるようになるとしている。モバイルアプリでも利用可能だが、本稿筆者の環境ではプロンプトは英語で入力する必要がある。


【その他の画像】


 Imagen 3は、今年のGoogle I/Oで発表された画像生成モデル。米国では「Pixel 9」シリーズの新アプリ「Pixel Studio」で利用可能になっている。


 Googleは2月、人物描画での批判を受けて人物画像生成機能を停止した。向こう数日中に、有料版Gemini(Gemini Advanced、Business、Enterprise)で人物画像の生成も再開するとしている。まずは英語でのプロンプトで利用可能になる見込みだ。


 同社は、「人物画像を生成する際のユーザー体験を大幅に向上させた。写実的で識別可能な人物、未成年者の描写、または過度に残酷で暴力的または性的なシーンの生成はサポートしない」というが、「他の生成AIツールと同様に、Geminiが生成するすべての画像が完璧になるわけではない」としている。


 Googleは同日、有料版Geminiで使えるオリジナルチャットbot生成機能「Gem」も発表した。