Spraakherkenning verbetert voor parkinsonpatiënten via aandachtig leren
AmsterdamOnderzoekers van de Universiteit van Illinois in Urbana-Champaign hebben de technologie voor automatische spraakherkenning verbeterd voor mensen met de ziekte van Parkinson. Ze voerden het Speech Accessibility Project uit, waarbij meer dan 151 uur aan spraak van personen met Parkinson werd opgenomen. Dit onderzoek resulteerde in een spraakherkenningsmodel dat 30% nauwkeuriger is dan modellen die zijn getraind op typische spraakpatronen.
Dit onderzoek kent vele voordelen:
- Verhoogde nauwkeurigheid voor alledaagse opdrachten, waardoor virtuele assistenten nog nuttiger worden.
- Betere communicatie met familie en zorgverleners.
- Meer zelfvertrouwen voor Parkinson-patiënten bij dagelijkse gesprekken.
Deze technologie is van groot belang omdat mensen met Parkinson vaak moeite hebben met duidelijk spreken, een aandoening die dysartrie heet. Dit maakt het voor hen lastig om spraakgestuurde apparaten te gebruiken. Door Automatic Speech Recognition (ASR) modellen te trainen om de spreekspecifieke kenmerken van Parkinsonpatiënten te begrijpen, kunnen deze apparaten hen beter verstaan en reageren.
Traditionele spraakherkenningssystemen hebben moeite met spraak die afwijkt van de standaardpatronen, wat frustrerend kan zijn voor gebruikers. Door ongebruikelijke spraakgegevens in grote hoeveelheden te verzamelen, kunnen onderzoekers deze systemen aanzienlijk verbeteren. Dit maakt niet alleen de huidige technologie gebruiksvriendelijker, maar stimuleert ook de ontwikkeling van nieuwe toepassingen voor mensen met spraakstoornissen.
Dit project kan helpen bij het ontwikkelen van meer op maat gemaakte hulpmiddelen. Naarmate slimme apparaten verbeteren, zullen mensen met spraakproblemen technologie eenvoudiger kunnen gebruiken, waardoor hun onafhankelijkheid toeneemt.
Dit onderzoek toont aan dat machine learning zeer nuttig kan zijn in de geneeskunde. Een dergelijke methode kan helpen bij andere spraakproblemen en nieuwe hulpmiddelen creëren om aan persoonlijke behoeften te voldoen. Het open delen van de dataset bevordert de samenwerking tussen onderzoekers en technologiebedrijven, wat essentieel is voor het realiseren van deze vooruitgangen.
Het project laat zien hoe samenwerking in onderzoek en het inclusief gebruiken van data de toegankelijkheidstechnologieën aanzienlijk kan verbeteren. Door deze vooruitgang voort te zetten, zal spraakherkenning voor iedereen bruikbaar worden, wat vooral de levens zal verbeteren van mensen die er het meeste baat bij hebben.
De studie is hier gepubliceerd:
http://dx.doi.org/10.1044/2024_JSLHR-24-00122en de officiële citatie - inclusief auteurs en tijdschrift - is
Mark Hasegawa-Johnson, Xiuwen Zheng, Heejin Kim, Clarion Mendes, Meg Dickinson, Erik Hege, Chris Zwilling, Marie Moore Channell, Laura Mattie, Heather Hodges, Lorraine Ramig, Mary Bellard, Mike Shebanek, Leda Sarι, Kaustubh Kalgaonkar, David Frerichs, Jeffrey P. Bigham, Leah Findlater, Colin Lea, Sarah Herrlinger, Peter Korn, Shadi Abou-Zahra, Rus Heywood, Katrin Tomanek, Bob MacDonald. Community-Supported Shared Infrastructure in Support of Speech Accessibility. Journal of Speech, Language, and Hearing Research, 2024; 1 DOI: 10.1044/2024_JSLHR-24-00122Deel dit artikel