Nesta se¸c˜ao, adotamos um modelo estat´ıstico para a distribui¸c˜ao dos coeficientes do sinal de voz e verificamos a validade do modelo atrav´es da compara¸c˜ao com um histograma de uma realiza¸c˜ao destes sinais. As distribui¸c˜oes das amplitudes dos coeficientes do sinal de voz e do ru´ıdo possibilitam escrever f´ormulas para o erro quadr´atico m´edio ap´os a aplica¸c˜ao das fun¸c˜oes de threshold. Por meio de um expe- rimento computacional, levanta-se a curva do erro e compara-se esta com a curva calculada a partir das distribui¸c˜oes. A semelhan¸ca destas comprova a validade do modelo estat´ıstico para os coeficientes da voz.
3.9.1
Distribui¸c˜ao do ru´ıdo
Cada uma das amostras do ru´ıdo segue uma distribui¸c˜ao normal de m´edia nula e desvio-padr˜ao σ, w [n]i.i.d.∼ N (0,σ) , n = 0, . . . , N − 1 ⇒ fw[n](u) = 1 σ√2πe −u2 2σ2. (3.63)
Como empregamos uma transformada em bloco ortogonal, os coeficientes do ru´ıdo tˆem a mesma distribui¸c˜ao que as amostras no tempo, ou seja,
W [k] i.i.d.∼ N (0,σ) , k = 0, . . . , N − 1 ⇒ fW [k](u) =
1 σ√2πe
−u2
2σ2 (3.64)
A Figura 3.17 apresenta uma compara¸c˜ao da fun¸c˜ao densidade de probabilidade te´orica com o histograma normalizado dos coeficientes DCT (Discrete Cosine Trans- form) de uma realiza¸c˜ao do ru´ıdo.
Uma vez conhecida a distribui¸c˜ao do ru´ıdo, podemos escrever a energia do ru´ıdo em fun¸c˜ao do limiar t, E||Wt||2 = E||wt||2 = Z ∞ −∞ ρ(S)t (u) 2 fw(u) du, (3.65)
onde ρ(S)t (·) ´e a fun¸c˜ao de limiar Soft.
A Figura 3.18 apresenta a curva da energia do ru´ıdo em fun¸c˜ao do limiar (Soft) sendo esta calculada, primeiro, pela m´edia das amostras e, depois, pela distribui¸c˜ao normal. Como se pode constatar, a curva obtida pelas amostras de uma realiza¸c˜ao do ru´ıdo muito se aproxima da curva te´orica calculada pela distribui¸c˜ao normal.
Figura 3.17: Histograma normalizado dos coeficientes da DCT do ru´ıdo. Escala vertical igual `aquela da Fig. 3.19, mais adiante, possibilita comparar os histogramas do ru´ıdo e do sinal. (Empregamos a seq¨uˆencia de ru´ıdo que produziu o sinal ruidoso da Tab. 3.1 e histograma com Nbin = 2001 segmentos.)
Figura 3.18: Energia dos coeficientes do ru´ıdo em fun¸c˜ao do limiar. A curva obtida de uma realiza¸c˜ao do ru´ıdo e aquela calculada pela fun¸c˜ao densidade de probabilidade do ru´ıdo coincidem. (Utilizada a mesma seq¨uˆencia de ru´ıdo da figura anterior.)
Aproxima¸c˜ao discreta de uma v.a. cont´ınua.
Nas simula¸c˜oes computacionais, utilizamos a aproxima¸c˜ao discreta explicada a seguir para calcular numericamente muitos resultados deste cap´ıtulo.
Suponha que a vari´avel aleat´oria cont´ınua W, igual a um dado coeficiente do ru´ıdo W [k], seja limitada ao intervalo [−cmax, cmax].
Definimos a vari´avel aleat´oria discreta X com valores equiespa¸cados neste interva- lo: u1, u2, . . ., uNbin, com ul =−cmax+ (l− 1/2) ∆u/2 e ∆u = 2cmax/Nbin. Considere
X com fun¸c˜ao massa de probabilidade pX (ul) , Pr{X = ul} igual `a probabilidade
de que W assuma valores no l-´esimo segmento: pX (ul) = Pr{ul− ∆u/2 < W ≤ ul+ ∆u/2} =
Z ul+∆u/2
ul−∆u/2
fW(v) dv ≈ fW(ul) ∆u.
(3.66) Nessas condi¸c˜oes, podemos calcular, de maneira aproximada, Eρ(S)t (W)2
= R∞ −∞ ρ(S)t (v) 2fW(v) dv ≈Pl ρ(S)t (ul) 2fW(ul) ∆u.
Note, ainda, que a fun¸c˜ao massa de probabilidade (PMF, Probability Mass Func- tion) pX(x) pode ser aproximada pelo histograma normalizado
pX(ul)≈
hl
N, (3.67)
em que hl ´e o n´umero de coeficientes dentro do l-´esimo segmento.
Para o histograma vale PNbin
l=1 hl = N , sendo Nbin o n´umero total de segmentos e
N o n´umero total de amostras (coeficientes).
3.9.2
Distribui¸c˜ao do sinal de voz
O modelamento estat´ıstico do sinal de voz (tamb´em considerado em [5]) sup˜oe que os coeficientes do sinal de voz seguem uma distribui¸c˜ao igual `a mistura de duas Laplacianas: S [k]i.i.d.∼ fS(u) = 1 √ 2σs rs e−√2αsσs2|u| αs + (1− rs) e−√2βsσs2|u| βs . (3.68)
Ou seja, cada coeficiente S [k], k = 0, . . ., N− 1, tem fun¸c˜ao densidade de probabili- dade (PDF, Probability Density Function) fS(u) e s˜ao estatisticamente independentes
entre si.
A Figura 3.19 compara o histograma normalizado de uma realiza¸c˜ao do sinal de voz com a curva prevista pela soma de Laplacianas. Os parˆametros das Laplacianas foram ajustados de maneira emp´ırica para que o MSEE, calculado mais adiante usando esta distribui¸c˜ao, se aproximasse, tanto quanto poss´ıvel, do MSEE te´orico.
Figura 3.19: Histograma normalizado dos coeficientes da DCT do sinal original e soma de laplacianas. (σs = 0.0173, rs = 0.92, αs = 0.12, βs = 3.53, sinal de entrada
da Tab. 3.1 e Nbin = 2001.)
Como foi feito para o ru´ıdo, a energia do sinal de voz em fun¸c˜ao do limiar t pode ser calculada por
E||St||2 = E||st||2 = Z ∞ −∞ ρ(S)t (u) 2 fs(u) du. (3.69)
A Figura 3.20 compara (a) a curva E||St||2× t prevista por esta equa¸c˜ao e (b) a
apenas uma realiza¸c˜ao (pois foi calculada usando o histograma) deve se aproximar mais da curva verdadeira (desconhecida). A curva prevista pela equa¸c˜ao n˜ao se ajusta muito bem `a curva calculada, possivelmente, devido aos valores empregados para os parˆametros da distribui¸c˜ao.
Figura 3.20: Energia do sinal original em fun¸c˜ao do limiar Soft: (a) prevista pela Equa¸c˜ao (3.69); (b) calculada usando uma realiza¸c˜ao do sinal de voz. (Mantidas as condi¸c˜oes da simula¸c˜ao anterior.)
3.9.3
C´alculo dos erros
Finalmente, podem ser comparadas as curvas do MSEE e do MSCE, ambos cal- culados a partir dos histogramas e das distribui¸c˜oes te´oricas. A Figura 3.21 permite constatar a validade do modelo adotado para a distribui¸c˜ao da voz, uma vez que o MSCE em (a) e o MSEE em (c), previstos pelas distribui¸c˜oes te´oricas, aproximam- se, respectivamente, do MSCE em (b) e do MSEE em (b), calculados a partir dos histogramas. Deve-se ressaltar, contudo, que as curvas de erro apresentam grande sensibilidade `a varia¸c˜ao dos parˆametros das Laplacianas, fato que denota pouca ro- bustez do m´etodo estat´ıstico e inviabiliza a utiliza¸c˜ao do mesmo na pr´atica, por isto, n˜ao empregamos este m´etodo para obter a superf´ıcie de erro SoftSoft e estimar os limiares ´otimos. Observe-se, por´em, que o bom ajuste das curvas previstas pelo mo- delo estat´ıstico certifica a sua validade te´orica. Al´em do mais, a validade do modelo estat´ıstico do sinal de voz sugere o uso do limiar inferior para selecionar coeficientes importantes pr´oximos `a origem, como aqueles observados na Fig. 3.19.
Finalmente, observe-se que as curvas calculadas usando o histograma s˜ao idˆenticas `as curvas calculadas a partir das amostras (ou coeficientes) de um sinal, pois
X l |ul|2p (ul) = NXbin i=1 |ul|2 hl
N (calculado usando o histograma) = 1
N
N −1X n=0
|x [n]|2 (calculado a partir das amostras). (3.70)
Por exemplo, a Figura 3.3 (calculada a partir das amostras) possui curvas MSCE e MSEE idˆenticas `aquelas da Figura 3.21 que foram calculadas usando os histogramas.
Figura 3.21: MSCE e MSEE Soft versus o valor do limiar, respectivamente: em (a) e (c) previstos pelas distribui¸c˜oes te´oricas; em (d) e (b) calculados a partir dos histogramas. (Soma de Laplacianas com σs= 0.0173, rs = 0.92, αs= 0.12, βs= 3.53.