重庆快乐十分

用于在音频信号中进行噪音抑制的方法与流程

文档序号:19069049发布日期:2019-11-06 02:50
用于在音频信号中进行噪音抑制的方法与流程

本发明涉及一种用于在音频信号中进行噪音抑制的方法。



背景技术:

在许多音频应用中,尤其是在处理麦克风信号时,出现噪声,应当在应用的过程中抑制噪声。在此,实际期望的有用信号通常与经常难以确定的噪声叠加。在此,噪声可能部分在很大程度上影响信号的可感知性。

在助听器中,有用信号经常存在于助听器的用户的对话伙伴的语音信号中。同样被助听器的麦克风接收并且相应地一起被进一步处理的周围环境的背景噪声,可能对用户产生干扰或者分散用户的注意力,因此为了识别语音贡献,可能需要明显更大的努力、尤其是集中注意力。为了抑制噪声,在许多助听器中,将助听器的内部信号划分到不同的频带中,并且为了抑制噪声,对于确定了特别高的噪声成分的频带,通过增益因子来减小信号。

重庆快乐十分然而,所描述的方法基于对于各个频带统一的增益因子相同地处理相关频带中的所有信号分量。现在,如果在一个频带中,实际期望的高的有用信号成分与明显的噪声叠加,则通过所描述的方法,由于根据高的噪声成分减小增益因子,因此有用信号成分也一起减弱。因此,这种噪声抑制甚至可能使信噪比(SNR)变差。

在许多情况下,期望的有用信号通过语音信号给出。语音信号的特征在于各个信号分量的特殊的谐波结构。由于这种谐波结构,对于语音信号的两个谐波分量之间的噪声的抑制,需要以如下频率分辨率对整个音频信号进行滤波,该频率分辨率将不同的谐波分量映射到不同的、优选不相邻的频带中。然而,由于由此在助听器中的信号处理中形成的长的等待时间和相应的时间延迟,由于对于谐波分量常见的频率和频率间隔而这样高的频率分辨率是不期望的。



技术实现要素:

因此,本发明要解决的技术问题在于,提供一种用于在音频信号中进行噪声抑制的方法,其尤其是针对与噪声叠加的音调(tonales)有用信号提供尽可能好的SNR。

重庆快乐十分根据本发明,所提到的技术问题通过用于在音频信号中进行噪声抑制的方法来解决,其中,针对多个预测时间点,分别根据预测时间点之前的音频信号的信号成分,对预测时间点之后的信号成分进行预测,其中,分别由预测时间点之后的信号成分形成预测的音频信号,并且其中,根据预测的音频信号产生噪声被抑制的音频信号。部分本身被视为具有创造性的有利的设计方案是从属权利要求和下面的描述的主题。

尤其是根据预测的音频信号,通过将预测的音频信号与音频信号或者与音频信号的经过预处理的信号成分混合或者叠加,来产生噪声被抑制的音频信号,其中,作为预处理,尤其是包括与频带相关的放大。

重庆快乐十分在此,预测时间点尤其是应当理解为音频信号的时间基准(Zeitreferenz)的范围内的时间点。这意味着,预测时间点之前的信号成分具有更早的时间基准,并且预测时间点之后的信号成分具有更晚的时间基准。分别预测之后的信号成分的多个预测时间点,因此在音频信号的时间基准的范围内形成时间序列。

优选选择预测时间点和在相应的预测时间点之后要预测的信号成分,使得这些信号成分覆盖直到下一个预测时间点的完整的时间段,也就是说,使得可以将直到下一个预测时间点的每一个时间点与预测的信号成分相关联,该预测的信号成分根据当前最后的预测时间点之前的信号成分被预测。这种关联尤其是也可以离散化地进行,从而在预测时间点之后的每个时间点,也一起存在表示相关的时间基准的音频样本(也称为音频采样值)。

尤其是也可以以如下方式形成预测的音频信号,即,使用多个预测时间点的针对特定的时间基准预测的信号成分。如果例如通过作为信号成分的各个音频样本进行预测,则可以相对于具体的时间基准,通过对相同的时间基准的分别在不同的预测时间点预测的多个音频样本进行加权平均,形成预测的音频信号的相应的音频样本。因此,在具体的时间基准中,作为多个叠加的信号成分的加权平均值,形成预测的音频信号,这些叠加的信号成分分别在不同的预测时间点被预测,但是总体上具有相同的时间基准。

也就是说,一般使用一个预测时间点之前的各个信号成分,来根据这些信号成分对该预测时间点处和/或之后的信号成分进行预测。因此,通过在时间上错开预测时间点,得到时间基准优选彼此相邻或者重叠的预测的信号成分,从而可以根据这些信号成分,与其各自的时间基准对应地形成独立的预测的音频信号。

在此,一方面利用如下情况,即,根据音频信号中的相关性(Korrelation),根据音频信号的已经存在的信号成分,来预测未来的信号成分,并且另一方面,音频信号中的常见的有用信号成分大多具有高的相关性。音频信号的相关的信号分量因此原则上是可预测的,而不相关的分量、例如统计分布的噪声原则上是不可预测的。因此,与初始的音频信号相比,预测的音频信号具有明显更高的成分的相关的信号分量,由此可以抑制音频信号中的不相关的噪声成分。

在此,应当考虑,在许多应用中,要处理的音频信号的有用信号经常非常强地相关。因此,例如音乐的音调分量具有非常高的相关性,因为音乐的音调分量基本上由基频和表示一个音调的声音的谐波泛音谱(harmonischen Obertonspektrum)构成,谐波泛音谱由基频的整数倍形成。语音的浊音(stimmhaften)分量、因此音调分量也在该频率范围内也具有这种谐波结构。在此,所述固定的频率分量、即基频和其谐波相应地导致有用信号成分的相应的周期性,这种周期性以信号成分的相应的相关性表现出来,由此通过预测可以特别好地采集这些有用信号分量,因此也对这些有用信号分量进行预测。因此,在进行预测时,与这些固定的频率分量叠加的不相关的噪声得到抑制。

优选对于一个预测时间点之前的音频信号的信号成分,相应地使用该预测时间点之前的多个音频样本。在此,尤其是首先可以将音频信号分解到各个频带中,并且作为要对信号成分进行预测的每个频带的各个信号成分,使用多个音频样本,使得通过相关频带中的多个音频样本,再现该频带中的音频信号的信号成分。在此,特别优选作为信号成分,使用在音频信号的相应的频带中或者(在宽带预测的情况下)在音频信号中紧接在相关预测时间点之前的无间隙的音频样本序列。然后,可以使用这些音频样本,通过尤其是离散的线性预测滤波器,来预测之后的信号成分。尤其是,在选择预测要使用的音频样本时,也可以一起使用将音频信号划分到各个频带中的滤波器组的过采样,从而在一个频带中,以尽可能没有不是初始的音频信号固有的相关性通过过采样一起进入信号成分的方式,选择音频样本作为与预测有关的信号成分。

适宜地,作为预测时间点之后的信号成分,分别预测一定数量的音频样本,其分别与相关预测时间点之后的时间基准相关联。在此,尤其是预测可以按照频带进行,从而针对进行预测的频带,分别在预测时间点之后产生具有相同的时间基准的不同的音频样本。在此,优选针对每个相关的频带或者(在宽带预测的情况下)在一个预测时间点总是仅预测一个音频样本,从而总是可以根据音频信号的当前最新的音频样本来预测每个预测的音频样本。

重庆快乐十分有利地,借助线性预测滤波器,根据预测时间点之前的音频信号的信号成分,来相应地对预测时间点之后的信号成分进行预测。即使原则上也可以以其它方式对相关的信号成分进行预测,除了低的数值复杂度和低的实现复杂度之外,线性预测滤波器还具有其它优点,即,线性预测滤波器特别是可以动态地匹配于当前的音频信号的情况。因此,当在音频信号中存在多个有用信号分量时,例如可以改变、尤其是增加滤波器长度、即要使用的音频样本以及相应的滤波系数的数量。由此可以改善预测的质量、即各个有用信号分量的“滤出”。

重庆快乐十分此外,可以根据音频信号和预测的音频信号单独改变滤波系数,从而预测滤波器总是使用最佳的滤波系数。在此,优选自适应地(adaptiv)根据预测的音频信号与音频信号的偏差来确定线性预测滤波器的滤波系数。也就是说,对于小的偏差来说,存在良好的预测,因此存在“正确的”滤波系数。在偏差增大时,可以相应地针对该偏差的最小化改变和调整滤波系数。

进一步证明有利的是,将音频信号分解到多个频带中,其中,相应地按照频带,根据预测时间点之前的音频信号的信号成分,预测相应的预测时间点之后的信号成分。在此,优选分别按照频带,在完全要进行预测的频带中,使用预测使用的预测时间点之前的信号成分。然后,针对相应的频带,根据音频信号的这些按照频带的信号成分,对预测时间点之后的信号成分进行预测。在此,原则上可能有利的是,预测仅局限于特定频带。

如果例如有用信号通过语音信号给出,则预测的音频信号中的噪声抑制尤其是在低频带中由于语音信号的谐波分量的高的相关性而提供特别好的结果。对于较高的频带,语音信号的分量也不再具有与低频带的谐波分量一样高的相关性,从而在此预测也可能抑制有用信号成分。现在,可以通过在较高的频带中以其它方式进行噪声抑制,来防止消除噪声被抑制的音频信号中的重要的有用信号分量。在这种情况下,在较高的频带中可以不进行预测。

重庆快乐十分在此,优选为了产生噪声被抑制的音频信号,将预测的音频信号与音频信号的信号成分按照频带混合,其中,根据相应的频带中的谐波分量的贡献和/或不相关的分量的贡献确定混合比。这尤其是可以在存在高份额的谐波分量的低频和实际上不再存在谐波分量的高频之间的过渡区域中进行。频带中的谐波分量的贡献的份额越高,则借助预测的噪声抑制通常在SNR方面越好。在过渡区域中,除了例如表示清音(stimmlose)语音(例如硬辅音)的其它分量之外,谐波分量也可以共存。如果仅根据预测的音频信号形成噪声被抑制的音频信号,则可能在进行预测时同样一起抑制所述有用信号的非谐波分量。所描述的根据谐波分量的混合在此使得能够进行补偿。

重庆快乐十分在此,尤其是可以预先通过按照频带的与噪声有关的增益因子,对要与预测的音频信号混合的音频信号的信号成分进行一般的噪声抑制。如果存在高份额的不相关的分量,则尤其是可以假设不相关的分量由噪声引起,而不是来自有用信号。在此,如果同时不存在谐波分量的贡献或者存在谐波分量的小的贡献,则可以优先主要通过所述一般的噪声抑制来处理相关频带。

在此,为了有利地产生噪声被抑制的音频信号,将预测的音频信号与音频信号的信号成分按照频带混合,其中,相应地按照频带对混合之前的音频信号的信号成分应用噪声抑制系数,并且其中,根据在预测的音频信号中相对于音频信号进行的噪声抑制,确定相应的频带中的噪声抑制系数。这意味着,为了产生用于一般的噪声抑制的按照频带的、与噪声相关的增益因子,检查在相关频带的预测的音频信号中由于预测而进行的噪声抑制有多大。现在,可以将一般的噪声抑制的增益因子减小该贡献,因为已经通过预测实现了该噪声抑制。在此,例如可以通过简单地比较频带中的音频信号和预测的音频信号的信号水平,来估计通过预测进行的噪声抑制,因为假设信号水平正是由于噪声抑制而降低的。

适宜地,对于多个频带,估计多个谐波分量的存在,其中,根据频带中的多个谐波分量,选择线性预测滤波器的滤波器长度。尤其是在语音作为有用信号的情况下,由于谐波分量的常见的间距(其总是在可听见的声音的频率范围内移动的基频的整数倍),并且由于频带的常见的宽度,可能出现如下情况,即,两个或者更多个谐波分量也落入一个频带中。这些谐波分量在该频带的信号成分中叠加。对于这种情况,优选使用更长的滤波器。这考虑到如下情况,即,在这些谐波分量叠加时,产生可能更复杂的周期特性,因此更长的滤波器、因此更多信号成分(例如更多音频样本)的使用对于预测是有利的。然而,如果仅存在一个谐波分量,则少量的信号成分对于预测可能已经足够了,并且为了降低计算的复杂度,可以相应地减小预测滤波器的长度。

重庆快乐十分此外,本发明涉及一种针对助听器进行噪声抑制的方法,其中,通过助听器的输入转换器,从周围环境的声音信号产生输入声音信号,其中,通过前面描述的用于在音频信号中进行噪声抑制的方法来抑制输入信号中和/或由输入信号导出的中间信号中的噪声,并且其中,根据由此产生的噪声被抑制的信号形成助听器的再现信号。此外,本发明涉及一种助听器,助听器具有用于产生输入信号的输入转换器以及信号处理单元,信号处理单元被配置为用于执行前面描述的用于在音频信号中进行噪声抑制的方法。在此,针对所述方法和针对其扩展方案给出的优点,同样可以转用于针对助听器进行噪声抑制的方法和助听器。尤其是,助听器被设置并且被配置为用于,通过在信号处理单元中对输入信号进行相应的处理,来校正助听器的用户的听力障碍。为此,优选在信号处理单元中与频带相关地,特别优选根据用户的听力图,对输入信号进行放大。用于在音频信号中进行噪声抑制的方法在这种助听器中的使用中是特别有利的。

重庆快乐十分由输入信号导出的中间信号在此尤其是包括通过与其它信号、例如用于抑制声音反馈的补偿信号、输入信号的总和或者差产生的信号,并且还包括通过根据用户的听觉预给定参数进行的与频率相关的放大和/或通过动态压缩由输入信号得出的信号。

附图说明

下面,根据附图详细说明本发明的实施例。在此分别示意性地:

图1相对于时间轴示出了根据音频信号的多个先前的音频样本对音频样本的预测,

图2示出了借助根据图1的预测在音频信号中进行噪声抑制的方法,

图3示出了具有语音作为有用信号的有噪声的音频信号以及相同的音频信号在通过根据图2的方法进行噪声抑制之后的频谱,以及

图4以框图示出了助听器。

重庆快乐十分在所有附图中,彼此相应的部分和参量分别设有相同的附图标记。

具体实施方式

在图1中示意性地相对于时间轴t绘出了音频信号1。在此,音频信号1以数字化的形式、即以音频样本2的形式存在。在此,各个音频样本2的幅值近似地描述了正弦曲线4,其中,与正弦曲线4的偏差是相对于有用信号的附加的噪声,有用信号通过与正弦曲线4对应的声音给出。在此,音频信号1的音频样本2仅在预测时间点t1之前存在。现在,使用通过预测时间点t1之前的最后N个音频样本2给出的音频信号1的信号成分2n1,来预测紧接在预测时间点t1之后的音频样本2t1。这通过长度为N的线性预测滤波器来进行。在此,线性预测根据在预测使用的信号成分2n1中存在的相关性来确定随后的音频样本2t1。在此,可以不预测不相关的统计噪声。

重庆快乐十分在此,所述相关性通过正弦曲线4给出,从而根据正弦曲线4预测随后的音频样本2t1,其中,附加的噪声由于没有相关性而在预测中仅产生很少的贡献,由于附加的噪声,在预测时间点t1之前的音频样本2中,幅值与正弦曲线4有偏差。对于预测的音频样本2t1,结果几乎是正弦曲线4的幅值的值,其中,相对于该值的很小的偏差由有限的滤波器长度N以及附加的噪声中的残留相关性造成。

现在,在音频样本2t1结束时,选择接下来的预测时间点t2,并且以刚刚描述的方式根据重新通过预测时间点t2之前的最后N个音频样本2给出的信号成分2n2,来对预测时间点t2之后的音频样本2t2进行预测。

现在,由预测的音频样本2t1、2t2形成预测的音频信号8,其走向与音频信号1相比明显更好地再现了正弦曲线4。因此,音频信号1中的附加的噪声由于预测而明显减小。如果假设在音频信号1中,有用信号分量是充分相关的,因此在借助预测进行噪声抑制时没有抑制实际期望的信号分量,则预测的音频信号8现在可以直接用作噪声被抑制的音频信号。然而,如果假设音频信号1中的有用信号成分也具有不相关的分量,则为了进行补偿,可以将预测的音频信号8与音频信号1的成分混合,以产生噪声被抑制的音频信号。由此强调音频信号1的在时间上相关的、即尤其是音调的有用信号分量,而不完全消除不相关的有用信号分量。此外,通过这种提升,仍然对不相关的噪声进行抑制。

重庆快乐十分图2示意性地以框图示出了用于借助根据图1的预测对音频信号1进行噪声抑制的方法。首先,通过滤波器组12将音频信号1分解到各个频带1a-f中。对于音频信号1的频带1a-f,现在一方面确定噪声抑制系数13a-f,对于一般的按照频带的噪声抑制,分别将噪声抑制系数13a-f与单个频带1a-f中的信号成分相乘。根据前三个频带1a-c中的信号成分,借助根据图1示出的通过预测进行噪声抑制的方法分别产生预测的音频信号8a-c。

重庆快乐十分在此,预测的音频信号8a-c的产生可以局限于下方的频带1a-c,因为随着频率升高,作为有用信号的语音信号的谐波成分减小,并且表示清音语音、例如相应的辅音的信号分量越来越占主导。然而,这种信号分量不再以谐波结构分布在频谱上,从而根据图1所示的方法所需的相关性不再以与在低频率范围内的谐波分量中相同的程度存在。在这种背景下,为了避免人为影响,如在图1中示出的借助减小来进行噪声抑制的方法的使用,被限制为所述方法以足够高的可靠性提供明显的优点的频带。

重庆快乐十分这在图2中借助频带1a-c示出,其中,所述方法的相应的使用一般不保持被限制为前3个频带,而是因此与滤波器组12的结构和由此产生的频带的实际的数量相关,此外,也可以动态地根据各个频带中的信号成分,尤其是根据其谐波信号分量的份额,来确定相应的使用。

在此,自适应地根据预测的音频信号8a-c与频带1a-c中的相应的初始的音频信号的相应的偏差,确定用来产生预测的音频信号8a-c的预测滤波器14a-c的滤波系数。此外,对于分别产生预测的音频信号8a-c的各个频带1a-c,确定相应的频带中的谐波分量的贡献16a的份额。在此,这针对第一频带1a象征性地示出,然而,这尤其是可以针对产生预测的音频信号8a-c的所有频带1a-c进行。可以根据谐波分量的贡献16a来改变预测滤波器14a的长度。在此,优选对于具有更大数量的谐波分量的频带,使用更长的滤波器。这考虑到如下情况,即,一个频带中的多个谐波分量导致这些谐波分量与可能更复杂的周期特性的叠加,因此更长的滤波器、因此更多音频样本的使用对于预测是有利的。然而,如果仅存在一个谐波分量,则少量的音频样本对于预测可能已经足够了,并且为了降低计算的复杂度,可以相应地减小预测滤波器14a的长度。

重庆快乐十分此外,针对预测的音频信号8a-c,分别确定在相应的预测的音频信号8a-c中相对于频带1a-c中的相应的音频信号进行的噪声抑制的度量(Maβ)18a。在此,这针对第一频带1a象征性地示出。在此,度量18a例如可以通过简单地比较预测的音频信号8a和频带1a中的音频信号的信号水平来实现,因为假设刚好通过噪声抑制来降低信号水平。现在,度量18a可以用于校正噪声抑制系数13a,因为可以假设已经通过预测的音频信号8a以度量18a抑制了频带1中的音频信号中的噪声,并且因此在一般的按照频带的噪声抑制的过程中不需要通过噪声抑制系数13a相应地附加地减小增益。在此,可以针对如下频带1a-c进行所描述的对噪声抑制系数13a的校正,针对这些频带,产生预测的音频信号8a-c,并且相应地可以确定通过预测进行的噪声抑制的度量。

在应用噪声抑制系数13a-c之后,可以将相关频带1a-c中的音频信号与相应的预测的音频信号8a-c混合,由此在相应的频带中产生噪声被抑制的音频信号10a-c。在此,尤其是可以根据相应的频带中的谐波分量的贡献16a,来确定多少份额的预测的音频信号8a-c在此进入噪声被抑制的音频信号10a-c的混合比,这在此针对第一频带1a象征性地示出,然而,优选这可以针对产生预测的音频信号8a-c的所有频带1a-c进行。最后,可以通过合成滤波器组20,将噪声被抑制的音频信号10a-c以及根据噪声抑制系数13d-f进行了噪声抑制的频带1d-f的音频信号,变换为时域中的唯一的噪声被抑制的音频信号10。

重庆快乐十分图3相对于频率轴f示出了有噪声的音频信号1的频谱(虚线),在音频信号1中,有用信号成分通过语音信号给出。在音频信号1中通过不相关的宽带的噪声叠加该语音信号。在此,在使用根据图1示出的进行抑制噪声的方法之后产生预测的音频信号8(实线)。可以明显地看到谐波分量22,其在音频信号1和预测的音频信号8中基本上提供相同的贡献。然而,对于谐波分量22之间的频率范围,在预测的音频信号8中证明了对噪声的明显的抑制。

重庆快乐十分图4示意性地以框图示出了助听器30。在此构造为麦克风的助听器30的输入转换器32从周围环境的声音信号34产生输入信号36。将输入信号36输送至信号处理单元38,并且在那里根据助听器30的用户的听力预给定参数进行处理,在此尤其是与频带有关地进行放大。信号处理单元38产生再现信号40,其通过助听器30的输出转换器42转换为输出声音信号44。在此,输出转换器42构造为扬声器。现在,可以在信号处理单元38中将根据图2描述的对音频信号进行噪声抑制的方法尤其是应用于作为音频信号1的输入信号36,或者也可以应用于由输入信号36导出的中间信号,例如中间信号可以通过对输入信号36进行预处理或者通过未详细示出的对声音反馈的抑制产生。

虽然在细节上通过优选的实施例详细说明和描述了本发明,但是本发明不局限于该实施例。本领域技术人员可以从中导出其它变形方案,而不脱离本发明的保护范围。

附图标记列表

重庆快乐十分1 音频信号

1a-f 频带

重庆快乐十分2 音频样本

重庆快乐十分2n1、2n2 信号成分

重庆快乐十分2t1、2t2 预测的音频样本

重庆快乐十分4 正弦曲线

8、8a-c 预测的音频信号

10、10a-f 噪声被抑制的音频信号

重庆快乐十分12 滤波器组

重庆快乐十分13a-f 噪声抑制系数

14a-c 线性预测滤波器

16a 贡献

18a 度量

20 合成滤波器组

22 谐波分量

重庆快乐十分30 助听器

32 输入转换器

34 声音信号

36 输入信号

38 信号处理单元

40 再现信号

重庆快乐十分42 输出转换器

44 输出声音信号

f 频率

N 样本的数量

t 时间

重庆快乐十分t1、t2 预测时间点

再多了解一些
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1
我是后台设置的统计JS代码