Nová generace umělé inteligence pro generování obrázků od OpenAI přináší něco, co vývojáři dlouho jen slibovali: možnost vytvářet smysluplné a vizuálně přesné produkce. GPT-4o už tedy nevytváří jen abstraktní scény, na kterých je umělost ještě stále vidět, ale generuje snímky , které mají dobrou výpovědní hodnotu.
Novinkou je přesnost zpracování zadaného textu. Vývojáři tvrdí, že AI nyní mnohem lépe rozumí kontextu a dokáže tak vygenerovat nejen vizuálně přitažlivé obrázky, ale takové, které lépe odpovídají zadání.
Vzhledem k tomu, že generování obrázků je integrováno do GPT-4o, mohou být výstupy zdokonalovány a doplňovány o detaily v přirozené konverzaci chatu. A umělá inteligence dokáže zpracovávat obrázky a text ve stejném duchu a ve stejné kvalitě. Když je například navržena postava do videohry, její vzhled zůstává konzistentní ve více iteracích. Uživatel ji tak může zdokonalovat a experimentovat.
we are launching a new thing today—images in chatgpt!
— Sam Altman (@sama) March 25, 2025
two things to say about it:
1. it's an incredible technology/product. i remember seeing some of the first images come out of this model and having a hard time they were really made by AI. we think people will love it, and we…
Žádné tabu, žádné zábrany
Uživatelé nové verze si už stačili všimnout jedné zajímavé vlastnosti – nový systém se nebojí kontroverzních témat. Díky minimálním omezením můžete vytvářet obrázky celebrit, politiků, a dokonce i jejich karikatury.

Sam Altman, šéf OpenAI, ostatně sám připustil, že nástroj umožňuje vytvářet „opravdu úžasné věci", které mohou některé lidi i pohoršit. A uživatelé toho s nadšením využívají – sociální sítě jsou plné obrázků veřejně známých osobností.
Jak to funguje?
Za vylepšením stojí nový tréninkový postup. Model byl podle tvůrců vycvičen na souboru obrázků s texty a chápe tak vizuální kontext novým způsobem. Výsledkem je přirozená „vizuální plynulost". Umělá inteligence tak už nepracuje jen s izolovanými daty, ale vnímá jejich vzájemné souvislosti.
Generování obrázků pomocí GPT-4o je nyní dostupné předplatitelům v ChatGPT a Sora. Sora je produkt OpenAI pro generování videí pomocí umělé inteligence. Podle OpenAI bude tato funkce brzy k dispozici i uživatelům ChatGPT Plus a dokonce i neplatícím uživatelům.
Článek obsahuje prvky vygenerované AI