パーキンソン病患者向け音声認識技術の革新

読了時間: 2 分
によって Pedro Martinez
-
パーキンソン病のシンボルを重ねた音声認識波形。

Tokyoイリノイ大学アーバナ・シャンペーン校の研究者たちは、パーキンソン病患者のための自動音声認識技術を向上させました。「音声アクセスプロジェクト」において、パーキンソン病の患者から151時間以上の音声データを収録し、そこから得られたモデルは、従来の音声パターンで訓練されたモデルに比べて30%精度が向上しました。

この研究には多くの利点がある。

  • 日常の命令に対する認識精度が向上し、バーチャルアシスタントの利便性が一段と高まりました。
  • 家族や医療提供者とのコミュニケーションが強化されました。
  • パーキンソン病のユーザーが日常会話において自信を持てるようになりました。

パーキンソン病患者は、話すときに声が不明瞭になることが多く、これを「構音障害」と呼びます。このため、音声操作デバイスの使用が難しくなります。しかし、自動音声認識(ASR)モデルをパーキンソン病患者の発話に対応できるよう訓練することで、デバイスは彼らの声をよりよく理解し、反応することができます。

標準的なパターンから外れた発話を認識するのが難しいとされている従来の音声認識システムは、ユーザーにとって不便なことがあります。研究者たちは、こうしたシステムの性能を向上させるために、多様な音声データを集めています。これにより、現在の技術がより使いやすくなるだけでなく、言語障害を持つ人々のための新しいアプリケーションの開発にも役立っています。

このプロジェクトは、個々のニーズに合った支援ツールの開発に役立つかもしれません。スマートデバイスの進化により、言語障害を持つ人々が技術をより簡単に利用でき、自立の道が広がります。

この研究によれば、機械学習は医療分野で非常に有益である可能性があります。このような方法は、他の音声問題の解決に役立ち、個々のニーズに応じた新しいツールを生み出すことができます。データセットを公開することで、研究者や技術企業が協力し、これらの進歩を実現させることが重要です。

研究の協力とデータを包括的に活用することで、アクセシビリティ技術が大きく向上することを示したプロジェクトです。これを一貫して進めることで、音声認識技術は誰もが使えるツールとなり、特に必要としている人々の生活向上に寄与します。

この研究はこちらに掲載されています:

http://dx.doi.org/10.1044/2024_JSLHR-24-00122

およびその公式引用 - 著者およびジャーナルを含む - は

Mark Hasegawa-Johnson, Xiuwen Zheng, Heejin Kim, Clarion Mendes, Meg Dickinson, Erik Hege, Chris Zwilling, Marie Moore Channell, Laura Mattie, Heather Hodges, Lorraine Ramig, Mary Bellard, Mike Shebanek, Leda Sarι, Kaustubh Kalgaonkar, David Frerichs, Jeffrey P. Bigham, Leah Findlater, Colin Lea, Sarah Herrlinger, Peter Korn, Shadi Abou-Zahra, Rus Heywood, Katrin Tomanek, Bob MacDonald. Community-Supported Shared Infrastructure in Support of Speech Accessibility. Journal of Speech, Language, and Hearing Research, 2024; 1 DOI: 10.1044/2024_JSLHR-24-00122
科学: 最新ニュース
次を読む:

この記事を共有

コメント (0)

コメントを投稿