Imagen 3 stanovuje podle Googlu nový standard v kvalitě obrázků, přičemž dokáže generovat obrazy na základě pouhých několika slov. Uživatelé mohou dokonce požádat Gemini o vytvoření obrázků v různých stylech - od fotorealistických krajin přes texturované olejomalby až po hravé scény v claymotion stylu.
Pokročilý model přichází s integrovanými bezpečnostními prvky. Stejně jako u předchozí verze Imagen 2, i zde je využíván nástroj SynthID pro vodoznaky AI generovaných obrázků. Principy designu jsou jasné: od začátku až do konce zůstává uživatel v kontrole nad tvůrčím procesem. Pokud počáteční obrázek nesplňuje očekávání, stačí Gemini jednoduše sdělit, co by mělo být změněno, a systém vygeneruje nový obrázek.
V následujících dnech zprovozní Google v Imagenu 3 i možnost vytvářet obrázky osob. Nejprve ve verzi dostupné pro uživatele Gemini Advanced, Business a Enterprise v anglickém jazyce. Služba prošla technickým vylepšením, včetně zlepšení evaluačních datasetů a množstvím zátěžových testů. Nicméně přesto v ní nebude možné vytvořit fotorealistický obrázek rozpoznatelných osob, zobrazit nezletilé, nebo příliš krvavé, násilné, či sexuální scény.
Zdroj: Google blog, Imagen 3