Přejít k hlavnímu obsahu

Revoluce v AI: Ochrnutá žena "mluví" prostřednictvím digitálního avatara

Pavel Trousil 25.08.2023
info ikonka
Zdroj:

Nové technologie založené na umělé inteligemci a vyvinuté na amerických univerzitách umožnily ochrnuté ženě znovu "mluvit" prostřednictvím digitálního avatara. Je to poprvé, kdy se podařilo převést mozkové signály zároveň na řeč i výrazy obličeje.

Kapitoly článku

Výzkumníci ze dvou významných kalifornských univerzit, UC San Francisco a UC Berkeley, dosáhli významného milníku v oblasti neurotechnologie. Navrhli rozhraní mozek-počítač (brain-computer interface - BCI), které umožnilo ženě ochrnuté v důsledku mozkové mrtvice vyjadřovat myšlenky a komunikovat prostřednictvím digitálního avatara.

Průlomová technologie dokáže mozkové signály převádět na text s pozoruhodnou účinností, a to rychlostí téměř 80 slov za minutu. To představuje výrazný pokrok oproti stávající BCI technologii. Výzkum, který byl nedávno publikován v časopise Nature, nese naději Dr. Edwarda Changa, hlavní postavy studie, že tento BCI brzy získá schválení FDA. Chang se výzkumu BCI věnuje již více než deset let a je nadšený jeho potenciálem přinést revoluci v komunikaci pacientů s podobnými onemocněními.

Jak mozkový implantát a umělá inteligence vrátily ochrnuté ženě hlas | UC San Francisco (UCSF)

V minulosti Changův výzkumný tým prokázal schopnost přeměnit mozkové signály na text. Jejich nejnovější snaha je však ještě ambicióznější. Cílem bylo zachytit složité nuance řeči a s nimi spojené pohyby obličeje během rozhovoru. Aby se to podařilo, zvolil tým sofistikovaný přístup. Pečlivě implantovali matrici 253 elektrod do kritických řečových oblastí mozku ženy. Tyto elektrody zachycovaly mozkové signály, které by za normálních okolností ovládaly její řečové svaly.

Nová strategie

Úspěch projektu do značné míry závisel na pečlivém tréninku zabudované umělé inteligence. Namísto trénování umělé inteligence na rozpoznávání celých slov, které by mohlo být těžkopádné a pomalé, přijal tým novou strategii. Umělou inteligenci vycvičili k dekódování slov pomocí fonémů - nejmenších jednotek mluveného jazyka. Například slovo "Hello" bylo rozděleno na fonémy: "HH", "AH", "L" a "OW". Zaměřením se na pouhých 39 klíčových fonémů dokázal systém efektivně rozluštit jakékoli anglické slovo, čímž byl rychlejší a přesnější.

Aby se digitální hlas věrně podobal původnímu hlasu ženy, použil tým inovativní algoritmus spolu s osobními nahrávkami z její minulosti. Pro animaci obličeje digitálního avatara byla klíčová spolupráce se společností Speech Graphics, která je známá svými odbornými znalostmi v oblasti animace obličeje na bázi umělé inteligence. Tato součinnost umožnila přesnou simulaci výrazů a pohybů obličeje, od základních pohybů rtů až po složité emoce, jako je štěstí a smutek.

Jedním z významných cílů tohoto projektu do budoucna je překonat současné kabelové spojení. Výzkumný tým by rád vytvořil bezdrátovou verzi BCI. Takové vylepšení by uživatelům poskytlo nejen větší svobodu, ale také by výrazně zlepšilo kvalitu jejich života, protože by jim poskytlo nezávislost při bezproblémové interakci s okolím a digitálními zařízeními.

Zdroj : Nature, ScienceDaily, BerkeleyUniversal-sci


Máte k článku připomínku? Napište nám

Sdílet článek

Mohlo by se vám líbit








Všechny nejnovější zprávy

doporučujeme