Um algoritmo de compressão pode ser avaliado por meio de diversos fatores, isto é, podem ser realizadas medidas a respeito de sua complexidade, a quantidade de compressão que este alcança e também o quanto a informação reconstruída é semelhante à original [Sayood, 2012]. Para se avaliar a qualidade da multimídia reconstruída e obter uma mensuração do quanto ela se modificou por conta da compressão são utilizadas as métricas de avaliação da qualidade da imagem.
Muitas vezes a informação comprimida e enviada por um meio de comunicação pode sofrer degradações. Estas podem ser causadas pelos ruídos presentes no meio. Da mesma forma, são aplicadas as técnicas de mensuração da qualidade para a avaliação do conteúdo recebido. Existem tantos fatores a se avaliar que somente este tópico é um extenso assunto de pesquisa.
Estas técnicas de avaliação da qualidade fazem uma comparação entre a informação original e a informação recebida ou reconstruída a partir da compressão e podem ser de dois tipos: subjetivas ou objetivas.
Uma avaliação subjetiva depende do conteúdo e dos objetivos do usuário em relação à multimídia. Um exemplo dessa diferença em relação ao objetivo do usuário ocorre quando este assiste a um filme comum em que o mesmo terá uma atitude passiva em relação ao conteúdo, diversamente de sua atitude ao observar um vídeo de vigilância no qual seja necessário detectar uma pessoa, sendo a atitude do usuário ativa e a qualidade da multimídia incomodará mais conforme seja o seu insucesso em reconhecer o agente alvo do vídeo [Richardson, 2011]. Tais aplicações são bastante distintas e portanto poderão causar mais desconforto e dificuldade em se atingir seus objetivos.
Nesse tipo de avaliação, o usuário fornece a sua opinião sobre a qualidade do que ele assiste. As informações obtidas são completamente pessoais e, portanto, é necessário realizar esses testes com um grupo amostral suficiente para se tirar alguma conclusão do sistema. Neste processo é fundamental levar em consideração também alguns fatores que podem influenciar a opinião das pessoas como o estado do usuário e de sua mente no momento da avaliação que pode afetar a sua decisão, condições como o ambiente de observação e o quanto o usuário interage com a cena observada. Todos este fatores podem modificar a opinião fornecida naquele momento [Richardson, 2011].
Dada a complexidade e o alto custo de se realizar experimentos de avaliação de qua- lidade subjetiva, outra forma de estimativa da qualidade é a métrica objetiva em que se elaboram equações matemáticas que aproximam-se do resultado de uma avaliação subje- tiva. Entretanto, o sistema humano é muito complexo e se torna muito difícil reproduzir exatamente uma avaliação humana [Richardson, 2011]. Várias medidas matemáticas po- dem ser feitas para se estimar a percepção de qualidade. A escolha de uma métrica
depende do que se deseja observar, ou seja, quais artefatos devem ser melhor detectados para indicar uma distorção no conteúdo avaliado.
Uma abordagem natural ao se tentar identificar distorções nas imagens é a estimação das diferenças entre o sinal de teste e o original. Por mais de 50 anos uma das métricas dominantes na avaliação objetiva da qualidade de um sinal foi o Erro Quadrático Médio (MSE) (do inglês, Mean-Squared Error). Portanto, o objetivo desta métrica é comparar dois sinais, produzindo uma medida quantitativa da similaridade ou distorção existente entre eles [Wang and Bovik, 2009].
Supondo duas imagens, uma original denotada como I1 e I2 que é a imagem de saída
do sistema (teste), a diferença entre estas imagens de tamanho M × N é obtida utilizando a seguinte equação: M SE(I1, I2) = 1 M × N M X i=1 N X j=1 (I1 (i,j)− I2 (i,j))2. (2.18)
Apesar de esta técnica receber críticas quando se trata da avaliação de sinais de voz e de imagem, ela é simples, de complexidade baixa e possui um significado bem claro: define a energia do erro da imagem [Wang and Bovik, 2009].
Outra opção e que é bastante utilizada na literatura para se medir a qualidade de uma imagem é a Relação Sinal-Ruído de Pico (PSNR) (do inglês, Peak-Signal-to-Noise Ratio). Esta é uma medida da quantidade de erro em relação ao valor de pico do sinal, ou seja, o valor mais alto na imagem. A medida do PSNR é dada para uma imagem em tons de cinza com 8 bits/pixel conforme a seguinte equação:
P SN R(dB) = 10 log10 255
M SE. (2.19)
o PSNR também usa uma escala logarítmica e depende do MSE da imagem original e a imagem de teste do sistema. O PSNR aproxima-se do infinito assim como o MSE aproxima-se de zero para indicar uma alta qualidade de imagem. Por outro lado, se o PSNR apresenta valores pequenos, isto indica que há uma alta diferença na imagem [Hore and Ziou, 2010].
Apesar da medida do PSNR apresentar péssima discriminação no conteúdo estrutural de imagens com diferentes tipos de degradações, alguns estudos mostram que que o MSE e, consequentemente, o PSNR possuem melhor performance em medir a qualidade de imagens ruidosas [Hore and Ziou, 2010] .
O PSNR consegue medir a distorção presente em uma imagem, dizendo o quanto a imagem está diferente em relação à original. Uma desvantagem do uso do PSNR é a sua ineficiência em relação a medição de erros perceptíveis ao ser humano. Portanto, se
o objetivo for saber o quanto duas imagens diferem (em relação a suas energias), esta métrica consegue ser simples e objetiva para se ter um resultado.
Capítulo 3
Revisão da Literatura
Este capítulo tem como objetivo mostrar trabalhos correlatos que serviram como base para o desenvolvimento deste. Portanto, os artigos seguintes embasam as premissas as- sumidas e a abordagem utilizada neste trabalho de dissertação, expondo as técnicas que tem como objetivo aumentar a qualidade da vista sintetizada ou que buscam a melhor relação de taxa-distorção, promovendo maiores níveis de compressões sobre os mapas de profundidade.