Umělá inteligence vyvolává obavy ze zkázy světa i z rušení pracovních míst. Ale může s ní být i legrace. Veselé video s Willem Smithem pojídajícím špagety vygenerovala umělá inteligence a stalo se na internetu hitem.
Minulý týden ho sdílel uživatel Redditu jménem "chaindrop". Rychle se rozšířilo na další sociální sítě a i do tisku. Například server Vice o něm uvedl, že video vás bude "strašit po zbytek života". Dvacetivteřinové němé video se skládá z deseti nezávisle generovaných dvousekundových segmentů poskládaných dohromady. Každý z nich ukazuje vygenerovaného Willa Smithe (v jednu chvíli dokonce dva Wily Smithe) z různých úhlů pohledu, jak hltavě pojídá špagety. Je to kompletně vytvořeno počítačem za podpory umělé inteligence.
Šlo konkrétně o open source nástroj s názvem ModelScope, který před několika týdny uvedla společnost DAMO Vision Intelligence Lab, výzkumná divize společnosti Alibaba. ModelScope je difuzní model "text2video", který byl vycvičen k vytváření nových videí na základě analýzy milionů obrázků a tisíců videí nashromážděných v datových sadách LAION5B, ImageNet a Webvid. Mezi ně patří i videa od Shutterstock, proto je na výstupu vodoznak "Shutterstock".
Vygenerování přitom není složité: stačí ModelScopu zadat podnět "Will Smith jí špagety" a vygenerujte video s 24 snímky za sekundu (FPS). Poté tvůrce použil interpolační nástroj Flowframes ke zvýšení FPS z 24 na 48 a následně video zpomalil na poloviční rychlost, aby bylo plynulejší. Nástrojů text2video je k dispozici víc.
Zdroj: Reddit