Voice recognition, de achilleshiel van AI.


De mogelijkheden van onze technologie lijken wel eindeloos. Toch blijkt er een zeer specifiek vakgebied waarin we steevast achter blijven. Samatha praat zonder problemen met Theodore, als een persoonlijkheid. Om deze conversaties mogelijk te maken is voice recognition echt een sleutelelement en net hiermee hebben wetenschappers het moeilijk. Wanneer men zowel de systemen van Google, Microsoft en IBM combineren is er nog steeds een foutenmarge van 8%. Wanneer mensen een telefoongesprek transcriberen ligt deze marge rond 4%.

Voor een nieuwe generatie van operating systems is spraakherkenning een sleutelelement. Het lijkt wel een bottleneck die we moeten doorbreken om dan verder te gaan in de ontwikkeling. Siri en Cortana doen al zeer goede pogingen en worden steeds geavanceerder. Maar zolang er problemen zijn bij de onderliggende technologie zal dit niet volledig doordringen in ons dagelijks leven.

Naast de technologische drempel is er natuurlijk ook een sociale drempel. In de samenleving van Theodore is het taboe om in een relatie te zijn met een OS. Bij ons is luidop praten tegen je smartphone in het openbaar al ongemakkelijk. De technologie is dus niet het enige waar voice recognition mee moet leren omgaan.

Bron: http://www.wired.com/2016/04/long-form-voice-transcription/

8 opmerkingen:

  1. Ja daar zitten ze inderdaad een beetje vast. Als ik bijvoorbeeld tegen Siri spreek dan verstaat hij me de helft van de tijd niet. Echt conversaties voeren lukt dus zeker (nu nog) niet.

    BeantwoordenVerwijderen
    Reacties
    1. Siri is nochtans een systeem met vrij veel persoonlijkheid in vergelijking met bijvoorbeeld Google Now die enkel dient als een abstracte virtual assistent. Je hebt wel helemaal gelijk dat ook bij Siri nog veel ruimte is om te groeien.

      Verwijderen
    2. Siri heeft het vooral moeilijk met accenten verstaan vindt ik. In 90% van de gevallen verstaat Siri/Google me wel accuraat. De problemen treden op wanneer ik zelf woorden in slik of talen mix of een streekwoord gebruik.

      Verwijderen
  2. Toch is de evolutie die de laatste jaren heeft plaats gevonden ivm voice recognition immens. Ik ben er vrij zeker van dat de technologie de volgende jaren steeds verder zal ontwikkelen en zo ook verbeteren.

    BeantwoordenVerwijderen
  3. ja ik volg Louise hierbij. Windows heeft een systeem ontwikkeld waarbij een voice profile aangemaakt kan worden die de gebruikte computer kan helpen om beter te worden in het verstaan van de gebruiker zelf.

    BeantwoordenVerwijderen
  4. Ik ben het met jullie eens, maar als je kijkt naar Siri de dag van vandaag vind ik dat er nog veel werk aan is. Maar het kan inderdaad snel gaan!

    BeantwoordenVerwijderen
  5. De personal assistants van nu nemen nog zeer veel dingen letterlijk, dus zelfs wanneer hij je verstaat kan hij het anders opvatten. Hierdoor kan je ook moeilijk natuurlijke conversaties met ze voeren, zoals in de film 'Her' wel het geval is. Door het HOC waarin het ging over personal assistants wilde ik deze ook eens testen op mijn kot. Helaas wareb al mijn kotgenoten daar en hoewel ik op mijn kamer zat, voelde het nogal debiel om tegen zo'n assistant te praten, zoals Ian aanhaalde in dit bericht. Ik wilde niet achteraf de vraag krijgen tegen wie ik was aan het praten of wie ik belde. We hebben deze technologie nog niet echt geaccepteerd volgens mij.

    BeantwoordenVerwijderen
    Reacties
    1. Vooral ook omdat we steeds de neiging hebben om te roepen tegen een persoonlijke assistent zodat deze ons zeker goed verstaat. Dit is eigenlijk niet nodig, maar toch doen de meesten dit als een reflex.

      Verwijderen