
三、连续交织采样策略
连续交织采样策略(continuous interleaved sampling,CIS)也可称为连续交叉采样,CIS利用双相电脉冲刺激蜗神经,分析多个通道(通常至少8个)的音频信号,并通过电刺激将这些信息全面传递到蜗神经,以尝试捕获传入声音信号的振幅包络。大多数的人工耳蜗制造商都采用了CIS策略。如图2-6-2所示,声音信号通过一组带通滤波器发送,这些滤波器将输入信号分解成离散的频带(注:在当代人工耳蜗系统中,滤波是通过数字信号处理而不是物理模拟滤波来实现的)。在整个信号处理过程中,由滤波产生的音调结构被保留下来,并最终通过位于耳蜗不同位置的电极呈现给听觉系统,即低频滤波器输出最终被传送到位于耳蜗(蜗轴)顶端的电极触点,而高频滤波器输出被传送到位于耳蜗基底端的电极触点。
CIS中使用的滤波器的带宽因不同的人工耳蜗制造商而异。这些滤波器的输出被引导到一个整流器,该整流器将正弦交流信号转换成双相恒电流脉冲信号。在整流器之后,信号通过一个低通滤波器发送,在那里它被转换成一个时间包络。这个包络类似于声输入的振幅包络。理想情况下,CIS脉冲率必须比低通滤波器的输出高4~5倍,以防止发生混叠错误(aliasing errors)。
因此,在典型情况下,言语信号中强的低频成分由发送到蜗顶电极的高振幅脉冲表示,而相对低量的高频成分则由发送到耳蜗基底电极的低振幅脉冲表示。在每个刺激周期中,所有电极都按顺序受到刺激,每个周期中的刺激幅度对应于相应通道中的能量。同样,脉冲序列的频率是固定的,并且在该刺激频率下持续发生刺激。典型的CIS脉冲率范围为800~1 600pps,通常使用8~16个电极。图2-6-3、图2-6-4分别为英文单词CHOICE的语谱图和英文单词CHOICE的CIS电极语谱图。通过语谱图描绘了言语信号的频率、时间及强度之间的关系。

图2-6-2 连续交织刺激(CIS)信号编码策略的电脉冲交织表示的一个示例
连续交叉采样策略框图。输入由图表最左侧的填充圆圈表示。该输入可以通过麦克风或其他来源提供,如用在教室中的调频无线连接。信号输入后,处理策略使用预加重滤波器(pre emp)来衰减语音中低于1.2kHz的强信号成分。此滤波器后为多通道处理。每个通道包括带通滤波器(BPF)、包络检测、压缩和调制阶段。包络检测通常使用全波或半波整流器(Rect.)后接低通滤波器(LPF)。也可以使用希尔伯特变换或不带低通滤波器的半波整流器。两个调制器的载波波形显示在两个相应的乘法模块(带有“×”标记的圆圈)的正下方,乘法模块的输出通过经皮连接(或一些早期系统中的穿皮连接器)被传送到耳蜗内电极(EL-1至EL-n)(插图显示了植入在耳蜗的X线片,声音处理器的输出被传输到该耳蜗)。
[框图来源:WILSON B S,FINLEY C C.LAWSON D T,et al.Better speech recognition with cochlear implants.Nature,1991,352(6332):236-238]

图2-6-3 英文单词CHOICE的自然语谱图
纵坐标为频率,越高频率越高;横坐标为时间。图中明暗度代表了强度,越明亮代表声音越响亮。(此图由项丽阳博士生成)

图2-6-4 英文单词CHOICE的CIS电语谱图
纵坐标为电极/通道;横坐标为时间。图中明暗度代表了强度,越明亮代表声音越响亮。
Wilson和RTI的团队专注于改进CIS策略,以实现更高级别的语音识别。CIS是当今大多数现代人工耳蜗使用的基础信号编码策略(如,HiRes,HiRes Fidelity 120,HiRes Optima,FSP,FS4,FS4-P)。
以下描述的多脉冲采样器、CIS +和高清High Definition CIS、HiResolution声音处理精细结构加工是CIS策略的衍生策略。
(一)多脉冲采样器
多脉冲采样器(multiple pulsatile sampler,MPS)是CIS的一种衍生策略,应用于领先仿生公司人工耳蜗设备。MPS提供部分同步刺激。具体地说,同时刺激两个彼此相距较远的电极(即,电极1和5、2和6、3和7、4和8);图2-1-2提供了在4通道处理器中实现的MPS的简易示例。MPS策略(部分同步刺激)允许刺激率翻倍(例如,刺激率从约800pps增加到约1 600pps),这在理论上应该可以改善言语识别(Wilson et al,2000)。然而,Wilson指出,MPS提供的部分同步刺激增加了同时受刺激通道之间的通道交互作用,而这种交互作用的后果是,轻者会抵消更快的刺激速率所带来的潜在益处,而最坏的情况可能会影响植入者听声效果。
(二)CIS +和高清CIS
CIS +和高清CIS(high definition CIS,HDCIS)是美迪乐公司提供的CIS衍生策略。CIS +的工作原理与传统的CIS类似,但是采用希尔伯特变换(Hilbert transformation)来代替传统CIS使用的常规波整流和低通滤波。希尔伯特变换的使用是为了更精确地估计输入信号并捕捉精细的时间结构线索。HDCIS可以使用更宽的频率范围来实现CIS策略(即,250~8 000Hz,可选择将带宽的低端设置为70Hz)。此外,HDCIS的总刺激率为50 704pps。
(三)HiResolution声音处理
HiResolution(HiRes)声音处理是CIS策略的另一种衍生策略,由领先仿生公司开发,并于2003年在美国上市使用。HiResolution与传统CIS的主要区别在于:①HiResolution提供了16个刺激电极,而不是CIS中典型的8个;②具有相当高的最大刺激率(如高达5 156pps);③低通滤波器具有更高截止频率(如2 800Hz);④更复杂的自动增益控制(automatic gain control,AGC)系统。HiResolution声音处理有两种商业形式——HiResS和HiResP:HiResS提供完全连续的刺激,HiResP提供部分同步刺激,这类似于MPS策略;HiResS可以提供刺激率高达2 900pps的脉冲序列,而HiResP的最大刺激速率为5 156pps。
2006年,领先仿生公司发布了一个新型HiRes版本,名为HiRes Fidelity 120,其中包含了电流把控(current steering)功能。电流把控功能试图通过同时刺激两个相邻的电极触点并在这两个触点之间形成一个新的刺激电场,从而增加频域中可感知通道的数量。通过使用电流把控,HiRes Fidelity 120可创建多达120个虚拟通道。
HiRes Optima是HiResolution声音处理家族的最新策略。HiRes Optima的主要目标是降低处理器的功耗需求。HiRes Optima整合了HiRes Fidelity 120的一些变化,这些变化都是为了在保持植入者效果的同时减少电池功耗。HiRes Optima通过将植入体的容顺电压值从8V降低到4V,通过修改电流把控模式使刺激仅通过虚拟通道传递,以及通过修改脉冲宽度管理方案来维持4V的容顺性限制,从而降低了电源电量需求。
(四)精细结构加工
精细结构加工(fine structure processing,FSP)是美迪乐公司提供的另一种新的CIS类型的信号编码策略,它与原来的CIS策略有两个重要的区别。与CIS +和HDCIS一样,美迪乐公司的FSP信号编码策略使用希尔伯特变换来分析音频输入信号并提取频谱、幅度包络,以及精细的时间结构信息。此外,可以使用钟形重叠带通滤波器(bell-shaped,overlapping bandpass filters)生成中间音高,以提供更好的频谱分辨率,这对于植入者识别包括基于位置编码(即,/s/、/f/、/t/)辨识的辅音高频音素非常重要。使用基于CIS的信号编码策略,提供中间音高精细的时间结构(如下所述)可以改善音质、噪声下的言语识别、音乐鉴赏和音乐识别。
美迪乐引入了FSP策略的两种衍生策略,即FS4和FS4-p。目前已发表的研究表明,FSP、FS4和FS4-p相对于CIS的听力改善效果好坏参半(Muller,2012;Magnusson,2011;Riss,2011;Riss,2008)。