Taligenkänning anpassar sig till Parkinson-tal med lärande

Ny forskning visar att röstigenkänningsteknik förbättras när den testas på patienter med Parkinsons sjukdom.

Lästid: 2 minuter

Av Pedro Martinez

- 5 oktober 2024 vid 07:58 i

Taligenkänningsvågformer med Parkinsonssymbol overlay.

StockholmForskare vid University of Illinois Urbana-Champaign har förbättrat röstigenkänningstekniken för personer med Parkinsons sjukdom. De genomförde ett projekt där de spelade in över 151 timmar av tal från individer med Parkinsons. Resultatet blev en modell för röstigenkänning som är 30% mer exakt än modeller som är tränade på typiska talmönster.

Denna forskning har många fördelar:

Ökad precision för dagliga kommandon, vilket gör virtuella assistenter mer användbara.
Förbättrade kommunikationsmöjligheter med familj och vårdgivare.
Stärkt självförtroende för personer med Parkinsons att delta i vardagliga samtal.

Denna teknik är viktig eftersom personer med Parkinsons sjukdom ofta har svårt att tala tydligt, vilket kallas dysartri. Detta gör det svårt för dem att använda röststyrda enheter. Genom att träna modeller för automatisk taligenkänning (ASR) för att förstå hur personer med Parkinsons talar, kan enheterna förstå och reagera bättre på dem.

Traditionella taligenkänningssystem har svårt att förstå tal som avviker från standardmönster, vilket kan vara frustrerande för användare. Genom att samla in stora mängder avvikande taldata kan forskare förbättra dessa system avsevärt. Detta gör inte bara nuvarande teknik mer användarvänlig, utan öppnar också upp för nya applikationer för personer med talhandikapp.

Läs också:

Stigande havsnivåer hotar infrastrukturen i kuststäder.

Idag · 15:53

Kusthoten ökar dramatiskt: miljoner i fara på grund av klimatförändringar vid Atlantkusten

Detta projekt kan bidra till att utveckla mer anpassade hjälpmedel. I takt med att smarta enheter förbättras kommer de att underlätta för personer med talproblem att använda teknik, vilket ger dem större självständighet.

Denna forskning visar att maskininlärning kan vara mycket användbar inom medicin. En sådan metod kan bidra till att lösa andra talproblem och utveckla nya verktyg för att tillgodose individuella behov. Genom att dela datamängden öppet främjas samarbete mellan forskare och teknikföretag, vilket är avgörande för att driva dessa framsteg.

Projektet demonstrerar hur samarbete inom forskning och inkluderande användning av data kan avsevärt förbättra teknik för tillgänglighet. Genom att fortsätta detta framsteg kommer röstigenkänning att bli ett verktyg som alla kan använda, vilket hjälper dem som behöver det mest.

Studien publiceras här:

http://dx.doi.org/10.1044/2024_JSLHR-24-00122

och dess officiella citering - inklusive författare och tidskrift - är

Mark Hasegawa-Johnson, Xiuwen Zheng, Heejin Kim, Clarion Mendes, Meg Dickinson, Erik Hege, Chris Zwilling, Marie Moore Channell, Laura Mattie, Heather Hodges, Lorraine Ramig, Mary Bellard, Mike Shebanek, Leda Sarι, Kaustubh Kalgaonkar, David Frerichs, Jeffrey P. Bigham, Leah Findlater, Colin Lea, Sarah Herrlinger, Peter Korn, Shadi Abou-Zahra, Rus Heywood, Katrin Tomanek, Bob MacDonald. Community-Supported Shared Infrastructure in Support of Speech Accessibility. Journal of Speech, Language, and Hearing Research, 2024; 1 DOI: 10.1044/2024_JSLHR-24-00122

Vetenskap: Senaste nytt