Pomohly už mnoha lidem dostat se při cestování z problémů. Řeč je o překladatelských aplikacích. S jejich pomocí můžete ukázat nebo poslat přeložená slova, věty i celé texty a obvykle si je nechat přečíst nahlas, pokud jiný druh komunikace není možný.
Díky umělé inteligenci budou tyto aplikace brzy k dispozici ve zcela nové kvalitě. A to nejen pro cestovatele, ale pro všechny, kdo musí profesně nebo soukromě komunikovat v jazycích, které pro daný účel neovládají vůbec nebo dostatečně dobře.
Google Audio PaLM rozpoznává text i řeč
Google AudioPaLM má posunout překlady na novou úroveň. Zdroj: Pixabay/Tessa Kavanagh
Google představil nový model umělé inteligence s názvem AudioPaLM, který dokáže rozpoznávat, zpracovávat a generovat text i řeč, např. pro překlady, a dokonce mluvit i hlasem příslušného uživatele.
Vědci demonstrují na stránce projektu poměrně působivé výsledky své práce na videu i s příklady zvukového srovnání v různých jazycích.
K vytvoření modelu stačí krátká mluvená výzva
Vědci si jsou jisti, že jejich nový model výrazně překonává stávající systémy překladačů. I krátký namluvený vzorek údajně stačí k tomu, aby model dokázal přeložit váš vlastní hlas do různých jiných jazyků.
AudioPaLM je kombinací jazykového modelu umělé inteligence Palm s generátorem zvuku AudioLM rovněž založeným na AI. Palm se používá také v chatbotu Bard společnosti Google. Na stránce projektu však nejsou žádné informace o tom, zda a kdy by AudioPaLM mohl být použit například v překladači Google. Můžete si tu poslechnout krátký klip, jak má Audio Palm fungovat v praxi. V ukázkách nechybí ani český překlad.
Zdroj: Google