Technologia ASR dla osób z chorobą Parkinsona zyskuje precyzję

Czas czytania: 2 minut
Przez Pedro Martinez
- w
Falowniki rozpoznawania mowy z nałożonym symbolem Parkinsona.

WarsawNaukowcy z Uniwersytetu Illinois w Urbana-Champaign udoskonalili technologię rozpoznawania mowy dla osób z chorobą Parkinsona. W ramach projektu Speech Accessibility Project nagrali ponad 151 godzin mowy osób cierpiących na tę chorobę. Dzięki temu opracowano model rozpoznawania mowy, który jest o 30% bardziej dokładny niż modele oparte na typowych wzorcach mowy.

To badania charakteryzuje się wieloma korzyściami:

  • Zwiększona precyzja w obsłudze codziennych poleceń podnosi przydatność asystentów wirtualnych.
  • Udoskonalone możliwości komunikacyjne z bliskimi i pracownikami służby zdrowia.
  • Większa pewność siebie w rozmowach codziennych dla osób z chorobą Parkinsona.

Technologia ta jest kluczowa, ponieważ osoby z chorobą Parkinsona często mają trudności z wyraźnym mówieniem, co nazywane jest dyzartrią. Utrudnia to korzystanie z urządzeń sterowanych głosem. Dzięki szkoleniu modeli rozpoznawania mowy (ASR), by lepiej rozumiały sposób mówienia osób z Parkinsonem, urządzenia mogą skuteczniej im odpowiadać.

Tradycyjne systemy rozpoznawania mowy mają trudności z rozumieniem mowy odbiegającej od standardowych wzorców, co może być frustrujące dla użytkowników. Dzięki zgromadzeniu dużej ilości danych dotyczących nietypowej mowy, naukowcy mogą znacznie poprawić działanie tych systemów. To nie tylko ułatwia korzystanie z obecnej technologii, ale także otwiera drzwi do nowych zastosowań dla osób z niepełnosprawnościami mowy.

Projekt ten może pomóc w opracowaniu bardziej dostosowanych narzędzi wspomagających. Wraz z rozwojem inteligentnych urządzeń, osoby z trudnościami w mowie będą mogły łatwiej korzystać z technologii, zyskując większą niezależność.

Badania te wskazują, że uczenie maszynowe może być bardzo przydatne w medycynie. Taka metoda mogłaby pomagać w rozwiązywaniu problemów z mową i tworzyć nowe narzędzia dostosowane do indywidualnych potrzeb. Otwarte udostępnianie zbiorów danych ułatwia współpracę między naukowcami a firmami technologicznymi, co ma kluczowe znaczenie dla realizacji tych postępów.

Projekt pokazuje, jak dzięki współpracy badawczej i inkluzywnemu podejściu do danych można znacząco usprawnić technologie ułatwiające dostępność. Kontynuując ten postęp, rozpoznawanie mowy stanie się narzędziem dostępnym dla każdego, co przyczyni się do poprawy jakości życia osób, które najbardziej tego potrzebują.

Badanie jest publikowane tutaj:

http://dx.doi.org/10.1044/2024_JSLHR-24-00122

i jego oficjalne cytowanie - w tym autorzy i czasopismo - to

Mark Hasegawa-Johnson, Xiuwen Zheng, Heejin Kim, Clarion Mendes, Meg Dickinson, Erik Hege, Chris Zwilling, Marie Moore Channell, Laura Mattie, Heather Hodges, Lorraine Ramig, Mary Bellard, Mike Shebanek, Leda Sarι, Kaustubh Kalgaonkar, David Frerichs, Jeffrey P. Bigham, Leah Findlater, Colin Lea, Sarah Herrlinger, Peter Korn, Shadi Abou-Zahra, Rus Heywood, Katrin Tomanek, Bob MacDonald. Community-Supported Shared Infrastructure in Support of Speech Accessibility. Journal of Speech, Language, and Hearing Research, 2024; 1 DOI: 10.1044/2024_JSLHR-24-00122
Nauka: Najnowsze wiadomości
Czytaj dalej:

Udostępnij ten artykuł

Komentarze (0)

Opublikuj komentarz