
二、特征提取策略
特征提取策略(feature extraction strategies)是从传入的音频信号中提取出被认为对言语识别较为重要的声学线索,然后以某种形式进行电刺激。特征提取策略包括F0/F1/F2策略和MPEAK策略。音频输入信号经过自动增益控制压缩,将植入者可能感兴趣的宽强度范围传送到相对狭窄的电动态范围,然后将信号分成不同的分析频带进行频谱分析。最低频率通道中的主频(即,基频)被用来调节发送到最顶端的蜗内电极触点的刺激率。调制低频刺激率以与最低频率通道中的频率一致,目的是捕获发声者声音的基频(F0)。继之,声音处理器尝试识别和提取第一和第二共振峰频率(F1和F2)。F1和F2的编码方法是根据每个共振峰的频率和相应的电极触点及根据位置原理将双相电脉冲传送到耳蜗内电极触点。提供给每个耳蜗内电极触点的电刺激的大小由输入信号的强度和听力师在调试过程中确定的植入者刺激需求决定。由于与高频音素有关的信息没有被编码并传送到蜗神经,故通常使用F0/F1/F2信号编码策略的植入者开放式言语识别有限(图2-6-1)。

图2-6-1 F0/F1/F2信号编码策略的实现框图(图来自JACE W,2018)
MPEAK信号编码策略包括与F0/F1/F2策略相同的信号处理过程,同时MPEAK还分析了三个高频通道(即,2 000~6 000Hz)的每一通道的能量,并将电脉冲传送到每个基底位置的蜗内电极触点,这些触点对应于高频频带解析中的频率信息。提供给每个蜗内电极触点的电刺激大小取决于相应分析频带(即,通道)中输入信号的强度,以及调试过程中确定的耳蜗内电极触点所需的刺激。MPEAK的平均言语识别通常比F0/F1/F2的效果较好(Dowell et al,1990;Hollow et al,1995;Parkinson et al,1996;Skinner et al,1991)。