Avances en reconocimiento de voz para el habla en personas con Parkinson

Tiempo de lectura: 2 minutos
Por Pedro Martinez
- en
Formas de onda de reconocimiento de voz con superposición del símbolo de Parkinson.

MadridInvestigadores de la Universidad de Illinois en Urbana-Champaign han mejorado la tecnología de reconocimiento automático de voz para personas con enfermedad de Parkinson. Llevaron a cabo el Proyecto de Accesibilidad del Habla, que consistió en grabar más de 151 horas de discurso de individuos con Parkinson. Este trabajo resultó en un modelo de reconocimiento de voz que es un 30% más preciso que los modelos entrenados con patrones de habla típicos.

Esta investigación tiene numerosas ventajas:

  • Mayor precisión en los comandos cotidianos, haciendo a los asistentes virtuales más útiles.
  • Capacidades mejoradas para comunicarse con la familia y los proveedores de salud.
  • Un aumento en la confianza de los usuarios con Parkinson para participar en conversaciones diarias.

Esta tecnología es crucial porque las personas con párkinson a menudo tienen dificultades para hablar con claridad, lo que se conoce como disartria. Esto les complica el uso de dispositivos controlados por voz. Al entrenar modelos de reconocimiento automático de voz (ASR) para comprender cómo hablan las personas con párkinson, los dispositivos pueden entenderlos y responderles de manera más efectiva.

Los sistemas tradicionales de reconocimiento de voz enfrentan dificultades para comprender el habla que se desvía de los patrones estándar, lo cual puede ser molesto para los usuarios. Reuniendo una gran cantidad de datos sobre formas de habla inusuales, los investigadores pueden mejorar significativamente estos sistemas. Esto no solo facilita el uso de la tecnología actual, sino que también impulsa la creación de nuevas aplicaciones para personas con discapacidades del habla.

Este proyecto podría contribuir a crear herramientas asistivas más personalizadas. A medida que los dispositivos inteligentes mejoren, facilitarán que personas con dificultades del habla usen la tecnología, brindándoles así mayor autonomía.

Esta investigación indica que el aprendizaje automático podría ser de gran utilidad en el ámbito médico. Un método de este tipo podría asistir con otros problemas de habla y desarrollar nuevas herramientas para satisfacer necesidades específicas. Compartir el conjunto de datos de forma abierta permite que investigadores y empresas tecnológicas colaboren, lo cual es crucial para lograr estos avances.

El proyecto demuestra cómo la colaboración en investigación y el uso inclusivo de datos pueden mejorar significativamente las tecnologías de accesibilidad. Al mantener este avance, el reconocimiento de voz se convertirá en una herramienta accesible para todos, beneficiando especialmente a quienes más lo necesitan.

El estudio se publica aquí:

http://dx.doi.org/10.1044/2024_JSLHR-24-00122

y su cita oficial - incluidos autores y revista - es

Mark Hasegawa-Johnson, Xiuwen Zheng, Heejin Kim, Clarion Mendes, Meg Dickinson, Erik Hege, Chris Zwilling, Marie Moore Channell, Laura Mattie, Heather Hodges, Lorraine Ramig, Mary Bellard, Mike Shebanek, Leda Sarι, Kaustubh Kalgaonkar, David Frerichs, Jeffrey P. Bigham, Leah Findlater, Colin Lea, Sarah Herrlinger, Peter Korn, Shadi Abou-Zahra, Rus Heywood, Katrin Tomanek, Bob MacDonald. Community-Supported Shared Infrastructure in Support of Speech Accessibility. Journal of Speech, Language, and Hearing Research, 2024; 1 DOI: 10.1044/2024_JSLHR-24-00122
Ciencia: Últimas noticias
Leer siguiente:

Compartir este artículo

Comentarios (0)

Publicar un comentario
NewsWorld

NewsWorld.app es un sitio de noticias premium gratuito. Proporcionamos noticias independientes y de alta calidad sin cobrar por artículo y sin un modelo de suscripción. NewsWorld cree que las noticias generales, de negocios, económicas, tecnológicas y de entretenimiento deberían ser accesibles a un alto nivel de forma gratuita. Además, NewsWorld es increíblemente rápido y utiliza tecnología avanzada para presentar artículos de noticias en un formato altamente legible y atractivo para el consumidor.


© 2024 NewsWorld™. Todos los derechos reservados.