Přejít k hlavnímu obsahu

OpenAI vylepšuje generování obrázků: text už není problém a ostych nemá ani u celebrit

Pavel Trousil 27.03.2025

Společnost OpenAI potěšila příznivce AI dalším velkým pokrokem ve svém nástroji pro generování obrazu. Obrázky vygenerované v modelu GPT-4o jsou mnohem fotorealističtější a přesnější. Do obrázku lze navíc začlenit text. A umělá inteligence se nebojí ani karikatur a celebrit.

Kapitoly článku

Nová generace umělé inteligence pro generování obrázků od OpenAI přináší něco, co vývojáři dlouho jen slibovali: možnost vytvářet smysluplné a vizuálně přesné produkce. GPT-4o už tedy nevytváří jen abstraktní scény, na kterých je umělost ještě stále vidět, ale generuje snímky , které mají dobrou výpovědní hodnotu.

Novinkou je přesnost zpracování zadaného textu. Vývojáři tvrdí, že AI nyní mnohem lépe rozumí kontextu a dokáže tak vygenerovat nejen vizuálně přitažlivé obrázky, ale takové, které lépe odpovídají zadání.

Mohlo by vás zajímat

Vzhledem k tomu, že generování obrázků je integrováno do GPT-4o, mohou být výstupy zdokonalovány a doplňovány o detaily v přirozené konverzaci chatu. A umělá inteligence dokáže zpracovávat obrázky a text ve stejném duchu a ve stejné kvalitě. Když je například navržena postava do videohry, její vzhled zůstává konzistentní ve více iteracích. Uživatel ji tak může zdokonalovat a experimentovat.

Žádné tabu, žádné zábrany

Uživatelé nové verze si už stačili všimnout jedné zajímavé vlastnosti – nový systém se nebojí kontroverzních témat. Díky minimálním omezením můžete vytvářet obrázky celebrit, politiků, a dokonce i jejich karikatury.

AI
info ikonka
Zdroj: Vygenerováno v OpenAI GPT-4o
Kamala Harris a Donald Trump jako klauni a „The Rock“ píše SMS při jízdě na kole.

Sam Altman, šéf OpenAI, ostatně sám připustil, že nástroj umožňuje vytvářet „opravdu úžasné věci", které mohou některé lidi i pohoršit. A uživatelé toho s nadšením využívají – sociální sítě jsou plné obrázků veřejně známých osobností.

Jak to funguje?

Za vylepšením stojí nový tréninkový postup. Model byl podle tvůrců vycvičen na souboru obrázků s texty a chápe tak vizuální kontext novým způsobem. Výsledkem je přirozená „vizuální plynulost". Umělá inteligence tak už nepracuje jen s izolovanými daty, ale vnímá jejich vzájemné souvislosti.

Mohlo by vás zajímat

Generování obrázků pomocí GPT-4o je nyní dostupné předplatitelům v ChatGPT a Sora. Sora je produkt OpenAI pro generování videí pomocí umělé inteligence. Podle OpenAI bude tato funkce brzy k dispozici i uživatelům ChatGPT Plus a dokonce i neplatícím uživatelům.

Zdroj: OpenAI, Cybernews, X

Článek obsahuje prvky vygenerované AI


Máte k článku připomínku? Napište nám

Mohlo by se vám líbit








Všechny nejnovější zprávy

doporučujeme