Aplikace Microsoftu "Seeing AI" dokáže pro zrakově postižené popsat okolí. Výzkumný projekt byl vyvinut speciálně pro nevidomé a slabozraké lidi a využívá možností umělé inteligence, aby jim zpřístupnil vizuální svět a popsal osoby, přečetl texty a upozornil na předměty v jejich okolí.
Mobilní aplikace "Seeing AI" je pro telefony iPhone k dispozici už od jara 2019, ale od té doby se neustále vyvíjí. V minulých dnech byla v obchodě Google Play poprvé zdarma ke stažení také verze pro Android.
"Seeing AI" lze využít v mnoha každodenních situacích. Můžete si například nechat předčítat krátké texty (cedule, poznámky) i celé dokumenty nebo při nakupování skenovat čárové kódy, abyste získali více informací o výrobku.
Aplikace v současné době rozpoznává následující (podle popisu výrobce):
- Krátký text: přečte text nahlas, jakmile se objeví před kamerou.
- Dokument: text se zobrazí na obrazovce a aplikace poskytuje zvukovou asistenci při snímání tištěné stránky a rozpoznává text spolu s jeho původním formátováním. Text si můžete nechat přečíst.
- Produkt: vydává zvukové efekty, aby se vám podařilo správně zaměřit fotoaparát na čárové kódy. Podle nich pak produkt identifikuje a napíše a řekne, o jaký jde. Dokáže pak dohledat další informace na internetu.
- Osoba: Rozpozná přátele a popíše lidi ve vašem okolí včetně jejich emocí.
- Scéna: Experimentální funkce pro popis scény kolem vás.
- Měna: Rozpoznává bankovky a jejich měnu při placení v hotovosti. Bohužel česká měna v seznamu není.
- Barva: Popíše barvu na kterou je zaměřen fotoaparát.
- Světlé: Vytváří akustický tón, který odpovídá jasu ve vašem okolí
Obrázky z jiných aplikací: pokud máte v telefonu nějaký obrázek či fotografii, nebo vám přijde třeba poštou, stačí klepnout na "Sdílet" a "Rozpoznat pomocí Seeing AI" a obrázky z e-mailů, fotografií, Twitteru a dalších si můžete nechat aplikací popsat.
"Seeing AI" funguje prostřednictvím umělé inteligence založené na cloudu. Neustálým používáním se shromažďuje velké množství dat, která by měla umožnit další zlepšování aplikace v průběhu času.
Bohužel s češtinou si aplikace neporadí. Dobře rozpozná text a přepíše ho na displeji, ale přečte ho s anglickou výslovností. U barev to lze ještě rozluštit, ale takto přečtený delší text se bohužel rozpoznat moc nedá. Přitom v nastavení aplikace to vypadá, že by bylo možné vybrat jiný modul pro převod textu na řeč. To se nám ale nepodařilo. Pokud by bylo možné přepnout na modul od Googlu s podporou češtiny, byla by aplikace skutečně užitečná i pro česky mluvící uživatele.
Přesto je to zajímavá aplikace, kterou lze použít například jako skener s OCR a pro rozpoznávání obsahu obrázků. Za vyzkoušení určitě stojí.
Zdroj: Microsoft, Apple, Google Play