报告主题:AI辅助下的运动型构音障碍病理语音研究


报  告 人:段淑斐 副教授 太原理工大学


报告时间:20231222日,2:00


报告地点:州大学博远楼305


报告简介:

       运动型构音障碍作为脑卒中常见的后遗症,其典型症状可能包括发声含糊不清、语速缓慢且响度降低等。临床上对于构音障碍的诊断多基于Franchy量表的评定,且康复治疗大多限于文本训练及唇舌肌肉按摩等,缺乏客观的数字化诊断模型和AI辅助下的康复治疗手段。本研究在病理语音研究领域中首先利用公开数据集进行前期探索,挖掘构音障碍病理人群在发音方面与正常人的差异性,进而推出辅助性的诊断指标。针对不同病情程度,采用AI算法进行病情分级研究。同时,本研究关注到病理语音数据分布的非平衡性,采用结合PCA、SMOTEclustering members的算法进行病理语音分类识别。

在研究国内外公开数据集基础上,我们发现领域内缺乏汉语病理语音库。同时,多项医学研究表明不同情感状态下的声学特征与皮层听觉诱发电位之间存在相关性,从而对症状的起因及效应进行解释,可依据情感的不同状态对病情程度分类诊断。虽然情绪对发声的直接影响已被研究证实,然而在目前的构音障碍患者康复治疗中,情绪影响下的治疗手段尚未被深入研究与实施。而在语音信号处理领域中,情感计算作为类脑计算的关键技术,已经取得了诸多成绩。如何将情感计算用于病理语音的诊断与治疗是亟待解决的关键问题。据此,本研究在构建情感发音数据集的经验基础之上,开展医工联合项目,构建了情绪性病理语音数据库,主要关注心理状态、言语情绪表达、面部表情与卒中患者病情发展的关联性研究。