Výskumníci z Microsoftu sa pochválili ďalším úspechom. Systém postavený na metódach umelej inteligencie, konkrétne neurónových sieťach, ktorý slúži na rozpoznávanie reči dosiahol presnosť porovnateľnú s človekom. Pod pojmom rozpoznávanie textu sa tomto prípade chápe automatický prevod hovoreného slova do textovej podoby.
Porovnanie pritom prebiehalo s profesionálnymi zapisovateľmi pri prepise telefonátov. Pri rozpoznávaní reči systém dosiahol chybovosť 5,9%, čo je podľa Microsoftu rovnaká a v niektorých prípadoch aj lepšia hodnota, ako tá, ktorú zaznamenal v prípade profesionálnych prepisovateľov. Microsoft zároveň informuje, že ide o najlepšiu hodnotu, akú kedy dosiahlo počítačové rozpoznávanie reči. Výsledky sa samozrejme týkajú anglického jazyka.
Dosiahnutie nového míľnika otvára dvere vylepšeniam pre rôzne produkty. Či už ide o konzolu Xbox, aplikácie pre uľahčenie prístupu alebo digitálnu asistentku Cortana. Nový výsledok výskumu však neznamená, že systém dokáže rozpoznať každé slovo bezchybne. Ide o to, že chybovosť, teda to ako často dochádza k nesprávnemu identifikovaniu hovoreného slova je na rovnakej úrovni, ako v prípade človeka, ktorý prepisuje totožný rozhovor.
Do budúcna sa výskumníci chcú zamerať na zlepšovanie rozpoznávania reči v hlučnom prostredí, ako aj na identifikáciu konkrétnej osoby pri rozhovore viacerých strán. Pozornosť budú venovať aj rozpoznávaniu reči s prízvukmi a ďalšími dialektmi. Osobitne sa však začnú venovať nie len rozpoznávaniu, teda prepisu toho, čo človek hovorí, ale aj pochopeniu, aký je zmysel toho, čo hovorí. Práve tam začína lepšia budúcnosť pre bezproblémové hlasové ovládanie počítačov.
Zdroj: Microsoft, obrázok