Onderzoekers van Microsoft beweren een zij software hebben ontwikkeld die net zo goed is als mensen in het herkennen van spraak. Volgens de onderzoekers (pdf) is hun computer in sommige gevallen even goed als een mens bij het omzetten van gesprekken naar tekst.
Een professionele menselijke transcribeerder heeft volgens het onderzoek een foutpercentage van 5,9 procent als twee mensen met elkaar praten zonder elkaar regelmatig te spreken. Bij regelmatige onderlinge sprekers, zoals vrienden of familie, is het foutpercentage van de transcribeerder 11,3 procent.
Het systeem van Microsoft kan een gesprek volgens de onderzoekers met dezelfde foutpercentages transcriberen. Ze maken daarvoor gebruik van een slim ontworpen systeem. Volgens de onderzoekers van het techbedrijf maakten de kunstmatige transcribeerder dezelfde fouten als de menselijke. Een groot verschil zat echter in het herkennen van stopwoorden als ‘uh’ en ‘uh-huh’.
Microsoft werkt aan zijn eigen spraakassistent, net als Apple (Siri), Google (Google Assistent) en andere techbedrijven. Van groot belang daarbij is dat Cortana, zoals de assistent van Microsoft heet, in staat is om de stem van mensen goed te herkennen en te begrijpen. Op die manier moet het makkelijker worden om iets aan zo’n assistent te vragen, waarna de software de vraag analyseert en vervolgens het juiste antwoord geeft.