OpenAI vylepšuje generování obrázků: text už není problém a ostych nemá ani u celebrit

Pavel Trousil 27.03.2025

Společnost OpenAI potěšila příznivce AI dalším velkým pokrokem ve svém nástroji pro generování obrazu. Obrázky vygenerované v modelu GPT-4o jsou mnohem fotorealističtější a přesnější. Do obrázku lze navíc začlenit text. A umělá inteligence se nebojí ani karikatur a celebrit.

Nová generace umělé inteligence pro generování obrázků od OpenAI přináší něco, co vývojáři dlouho jen slibovali: možnost vytvářet smysluplné a vizuálně přesné produkce. GPT-4o už tedy nevytváří jen abstraktní scény, na kterých je umělost ještě stále vidět, ale generuje snímky , které mají dobrou výpovědní hodnotu.

Novinkou je přesnost zpracování zadaného textu. Vývojáři tvrdí, že AI nyní mnohem lépe rozumí kontextu a dokáže tak vygenerovat nejen vizuálně přitažlivé obrázky, ale takové, které lépe odpovídají zadání.

Mohlo by vás zajímat

OpenAI spouští Soru: výkonný nástroj pro generování videí z textu

Novinky

Vzhledem k tomu, že generování obrázků je integrováno do GPT-4o, mohou být výstupy zdokonalovány a doplňovány o detaily v přirozené konverzaci chatu. A umělá inteligence dokáže zpracovávat obrázky a text ve stejném duchu a ve stejné kvalitě. Když je například navržena postava do videohry, její vzhled zůstává konzistentní ve více iteracích. Uživatel ji tak může zdokonalovat a experimentovat.

we are launching a new thing today—images in chatgpt!

two things to say about it:

1. it's an incredible technology/product. i remember seeing some of the first images come out of this model and having a hard time they were really made by AI. we think people will love it, and we…
— Sam Altman (@sama) March 25, 2025

Žádné tabu, žádné zábrany

Uživatelé nové verze si už stačili všimnout jedné zajímavé vlastnosti – nový systém se nebojí kontroverzních témat. Díky minimálním omezením můžete vytvářet obrázky celebrit, politiků, a dokonce i jejich karikatury.

Kamala Harris a Donald Trump jako klauni a „The Rock“ píše SMS při jízdě na kole.

Sam Altman, šéf OpenAI, ostatně sám připustil, že nástroj umožňuje vytvářet „opravdu úžasné věci", které mohou některé lidi i pohoršit. A uživatelé toho s nadšením využívají – sociální sítě jsou plné obrázků veřejně známých osobností.

Jak to funguje?

Za vylepšením stojí nový tréninkový postup. Model byl podle tvůrců vycvičen na souboru obrázků s texty a chápe tak vizuální kontext novým způsobem. Výsledkem je přirozená „vizuální plynulost". Umělá inteligence tak už nepracuje jen s izolovanými daty, ale vnímá jejich vzájemné souvislosti.

Mohlo by vás zajímat

Musk se pokusil koupit OpenAI, která stojí za ChatGPT: její šéf se mu ale vysmál – odplatou mu byla nálepka švindlíře

Novinky

Tvář Elona Muska a část loga ChatGPT v pozadí

Generování obrázků pomocí GPT-4o je nyní dostupné předplatitelům v ChatGPT a Sora. Sora je produkt OpenAI pro generování videí pomocí umělé inteligence. Podle OpenAI bude tato funkce brzy k dispozici i uživatelům ChatGPT Plus a dokonce i neplatícím uživatelům.

Zdroj: OpenAI, Cybernews, X

Článek obsahuje prvky vygenerované AI

Máte k článku připomínku? Napište nám

Předplatné

Digitální chip

Kontakty

Earchiv

OpenAI vylepšuje generování obrázků: text už není problém a ostych nemá ani u celebrit