O termo “ru´ıdo musical” ´e assim denominado pois ´e percebido como um som met´alico, tamb´em conhecido como “ru´ıdo de tom musical” por causa de seu espectro
com largura de banda estreita e som semelhante `aquele produzido ao se bater num objeto met´alico.
O ru´ıdo musical ocorre, freq¨uentemente, nos m´etodos de redu¸c˜ao de ru´ıdo usando transformadas e s˜ao observados como esp´urios no sinal de sa´ıda provocados pela va- ria¸c˜ao aleat´oria das caracter´ısticas do ru´ıdo. Estes esp´urios, percebidos como tons de curta dura¸c˜ao em freq¨uˆencias aleat´orias, por vezes, s˜ao mais desagrad´aveis e causam maior fadiga ao ouvinte do que o ru´ıdo branco anteriormente presente no sinal de entrada.
No caso da subtra¸c˜ao espectral, as distor¸c˜oes s˜ao provenientes, principalmente, do processamento n˜ao-linear que se faz ao mapear os valores negativos de espectro produzidos pela subtra¸c˜ao espectral e decorrentes das varia¸c˜oes aleat´orias do ru´ıdo. Na Fig. 2.12a, tem-se um exemplo ilustrativo do espectro do sinal de entrada (ruidoso) e, na Fig. 2.12b, pode-se observar dois tipos de distor¸c˜oes no espectro de sa´ıda: 1) picos ou vales estreitos anteriormente inexistentes no espectro do sinal; 2) faixas isoladas de freq¨uˆencias. O primeiro, geralmente, ´e mascarado pelas componentes espectrais adjacentes, pertencentes ao sinal de voz. J´a o segundo ´e a causa principal de esp´urios aud´ıveis, sendo percebidos como ru´ıdo musical, principalmente nos intervalos de tempo em que ocorrem v´arios blocos com predominˆancia do ru´ıdo [12].
No caso dos m´etodos de threshold, o ru´ıdo musical surge pois coeficientes do ru´ıdo que possuem amplitude maior do que o limiar acabam “sobrevivendo” `a fun¸c˜ao de threshold. Em conseq¨uˆencia, estes coeficientes produzem, no sinal de sa´ıda, tons de curta dura¸c˜ao e em diferentes freq¨uˆencias. A dura¸c˜ao de cada tom ´e igual `a dura¸c˜ao dos blocos [5]. Por exemplo, um sinal amostrado a 8000 amostras/s dividido em blocos de 128 amostras apresentar´a tons com dura¸c˜ao de 16 ms. Na Figura 2.13, pode-se observar em a) um bloco de coeficientes do ru´ıdo e em b) o mesmo bloco ap´os a opera¸c˜ao de limiar Hard.
Tanto na subtra¸c˜ao espectral quanto nos m´etodos que empregam fun¸c˜oes de limiar, o ru´ıdo musical desaparece (ou torna-se impercept´ıvel) quando se diminui o n´umero de componentes espectrais atenuadas ou eliminadas, ainda que isto seja feito `as custas de uma menor redu¸c˜ao do ru´ıdo. Deve-se dizer que, de maneira geral, quando o ru´ıdo musical se torna impercept´ıvel, a quantidade de ru´ıdo remanescente na sa´ıda ainda
Figura 2.12: Tipos de distor¸c˜oes observadas no espectro de sa´ıda de um m´etodo de subtra¸c˜ao espectral. (Entrada: 1024 amostras da vogal /a/ com 0 dB de AWGN. Subtra¸c˜ao espectral de potˆencia: ρ = 2, piso espectral nulo, FFT de blocos de com- primento 256 amostras e janela de hanning com 50% de sobreposi¸c˜ao. Gr´aficos apre- sentam o espectro LPC de ordem 64 da entrada e sa´ıda.)
´e muito elevada, portanto, em aplica¸c˜oes pr´aticas, n˜ao ´e poss´ıvel estabelecer uma rela¸c˜ao de compromisso satisfat´oria entre os objetivos de manter o ru´ıdo musical impercept´ıvel e de reduzir o ru´ıdo da entrada.
No caso da subtra¸c˜ao espectral isto pode ser feito “sub-estimando” o n´ıvel de ru´ıdo, ou seja, considerando um espectro m´edio de ru´ıdo menor do que o medido. Por exemplo, podemos aumentar o ganho G (f ) empregando um parˆametro |ρ| < 1 em (2.25) ou (2.26). Al´em disso, esquemas mais elaborados podem se basear na informa¸c˜ao de um detector de atividade de voz (VAD, Voice Activity Detector ) e alterar o valor do ganho de maneira conveniente.
J´a no caso dos m´etodos de threshold, o valor do limiar pode ser reduzido para combater o ru´ıdo musical. Como este procedimento sempre acarreta em um maior ru´ıdo na sa´ıda; talvez, uma estrat´egia melhor, seja permitir que o sinal estimado
Figura 2.13: a) Coeficientes de um bloco de ru´ıdo. b) Coeficientes do ru´ıdo ap´os opera¸c˜ao de threshold Hard, com limiar t = 1, representado pela linha tracejada. (Detalhes da simula¸c˜ao: bloco de ru´ıdo com 64 amostras, produzido por randn do Matlab usando state=0; utilizada transformada FFT e apresentado o m´odulo dos coeficientes com ´ındices 0 a 31.)
tenha um pouco de ru´ıdo musical e aplicar o procedimento que descrevemos a seguir para eliminar estes esp´urios.
2.10.1
P´os-processamento Contra o Ru´ıdo Musical
Os m´etodos de redu¸c˜ao de ru´ıdo no dom´ınio transformado, geralmente, apresentam ru´ıdo musical, por isso, apresentamos nesta se¸c˜ao um m´etodo (explicado em [12, Sec. 11.2.3]) para combater este tipo de esp´urio.
Os “tons musicais” podem ser identificados pela an´alise das varia¸c˜oes do sinal nos dom´ınios do tempo e da freq¨uˆencia, uma vez que estes, geralmente, tˆem curta dura¸c˜ao, pequena amplitude, banda estreita em por¸c˜oes isoladas do espectro de freq¨uˆencias e s˜ao cercados de componentes do sinal com baixa amplitude.
Por exemplo, para um comprimento de bloco de 128 amostras e uma taxa de amostragem de 20 kHz, experimentos indicam que a maioria dos tons musicais n˜ao duram mais do que uma janela de tempo correspondente a trˆes blocos. O mesmo n˜ao se verifica para as componentes do sinal de voz que, em geral, duram mais de trˆes blocos [12, p´ag. 334].
No processamento do sinal y [n], este ´e dividido em blocos de L amostras. Cada bloco ´e transformado em um bloco de L coeficientes, que denotamos genericamente por Ym[k]. Blocos sucessivos de coeficientes espectrais podem ser dispostos em uma
matriz tempo-freq¨uˆencia que denotamos por Y = {Ym[k]}k,m, sendo m o ´ındice do
bloco (correspondente ao tempo na representa¸c˜ao tempo-freq¨uˆencia adotada). Dessa forma, podemos interpretar Yk,m como o k-´esimo canal de um banco de filtros.
Na Figura 2.14, apresentamos a id´eia b´asica do m´etodo: cada canal ´e examinado para identificar tons musicais com dura¸c˜ao inferior ao n´umero estabelecido de blocos, amplitude abaixo de um certo valor pr´e-fixado e que n˜ao tenha sido mascarado por componentes de sinal nos canais vizinhos. Uma vez classificada como esp´urio, seus coeficientes s˜ao removidos.