Um sinal de v´ıdeo sem compress˜ao pode atingir 270 Mbits/s para SD (do inglˆes, Standard Definition) e 1,5 Gbits/s para HD, sendo que a taxa de bits disponibilizada pelos sistemas de transmiss˜ao da TV digital terrestre est´a em torno de 19 Mbits/s [ALENCAR 2007b].
Tabela 2.1: Espa¸co ocupado por algumas m´ıdias n˜ao comprimidas, em formato digital [BECKER e VARGAS 2004].
M´ıdia 1 hora de v´ıdeo em VHS 1 hora de TV de alta defini¸c˜ao
Espa¸co ocupado 24,3 GB 389 GB
Observando a tabela 2.1 de ocupa¸c˜ao do espa¸co pelas m´ıdias, ´e f´acil verificar a necessidade da compress˜ao. Recebendo 60 minutos de v´ıdeo em qualidade VHS (do inglˆes, Video Home System), seriam necess´arias aproximadamente 240 horas (10 dias) para receber o v´ıdeo inteiro [BECKER e VARGAS 2004].
O subsistema de codifica¸c˜ao de v´ıdeo consiste em um codificador de v´ıdeo - no bloco Difus˜ao e Acesso -, e um decodificador de v´ıdeo - no bloco Terminal de Acesso. Entre esses dois blocos est˜ao o Canal de Radiodifus˜ao e o Canal de Interatividade. Por meio do Canal de Radiodifus˜ao, os sinais de ´audio, v´ıdeo e dados s˜ao transmitidos [ALENCAR 2007b].
Uma imagem digitalizada ´e formada por uma sequˆencia de quadros (frames), que s˜ao formados por menores representa¸c˜oes de uma imagem denominadas pixels. Um pixel ´e composto pelas componentes de luminˆancia e duas de crominˆancia (Y, Cr e Cb respectivamente). Um bloco ´e um grupo de pixels e um conjunto de bloco forma um macrobloco.
Os macroblocos podem ser divididos em sub-macrobloco. Um conjunto de macro- blocos em uma mesma linha ´e um slice. Um conjunto de todos os slices ´e chamado de imagem. Um conjunto com 15 imagens ´e chamado de GOP (do inglˆes, Group of Pictures) e o conjunto de GOP’s ´e um v´ıdeo.
O padr˜ao H.264/AVC ´e o primeiro que prevˆe a utiliza¸c˜ao de macroblocos com ta- manhos vari´aveis (16x16, 16x8, 8x16 ou 8x8 pixels). Uma parti¸c˜ao 8x8 ´e chamada sub-macrobloco e um sub-macrobloco com parti¸c˜ao 8x8 pode ser particionado em blocos de 8x8, 8x4, 4x8 ou 4x4 pixels [Puri et al. 2004]. A Figura 2.4 mostra a divis˜ao de um quadro em v´arias parti¸c˜oes.
Tudo isso forma a imagem. Um dos desafios do sistema de televis˜ao digital s˜ao os v´arios tipos de redundˆancia: espacial, temporal e entr´opica. Segundo [Montez e Becker 2004], a redundˆancia espacial ou intraframe ocorre quando, numa mesma imagem, temos largas regi˜oes com as mesmas caracter´ısticas como, por exem- plo, um fundo extenso da mesma cor (redundˆancia entre pixels de um mesmo qua- dro). Dessa forma, ao inv´es de transmit´ı-las inteiras o sistema informa que toda aquela ´area ´e igual.
Figura 2.4: Quadro com v´arias parti¸c˜oes.
A redundˆancia entr´opica tem por objetivo transmitir o m´aximo de informa¸c˜ao pos- s´ıvel por s´ımbolo codificado e, deste modo, representar mais informa¸c˜oes com um n´umero menor de bits.
J´a redundˆancia temporal (interframe)[Wiegand et al. 2003], acontece quando deta- lhes de uma imagem n˜ao mudam na passagem de um quadro para outro (semelhan¸ca entre quadros sucessivos). Ela explora as similaridades. A partir de um quadro, ela pode estimar o pr´oximo. A Figura 2.5 ilustra essa composi¸c˜ao de v´ıdeo.
Figura 2.5: Amostras espaciais e temporais.
Tanto a compress˜ao temporal quanto a espacial tem perdas. Se houver um aumento na taxa de compress˜ao nesses dois tipos, a qualidade final da imagem ter´a uma
diminui¸c˜ao. J´a a compress˜ao entr´opica, que reconstitui o sinal bit a bit, ´e sem perdas.
No caso do Sistema Brasileiro de Televis˜ao Digital, o padr˜ao H.264 - tamb´em cha- mado de MPEG-4 ou parte 10 ou AVC (do inglˆes, Advance Video Coding) e fre- quentemente mencionado como H.264/AVC - tem como caracter´ısticas principais a alta capacidade de compress˜ao de dados porque reduz o tamanho de um arquivo de v´ıdeo digital em 80% a mais quando comparado ao formato JPEG e 50% a mais em rela¸c˜ao ao MPEG-4. O H.264 possui uma qualidade de v´ıdeo superior para uma de- terminada taxa de bits e desempenho [Recommendation 2003], e tem decodifica¸c˜ao de correspondˆencia exata que define exatamente como os c´alculos num´ericos devem ser feitos por um codificador e um decodificador. O MPEG-4 tem mais de 20 partes (documentos), mas s˜ao as partes 2 e 10 as respons´aveis pelo processo de codifica¸c˜ao de v´ıdeo.
No terminal Difus˜ao e Acesso, o codificador de v´ıdeo recebe como entrada o sinal de v´ıdeo digital n˜ao comprimido. Al´em disso, ele realiza a compress˜ao e gera um fluxo de v´ıdeo codificado como sa´ıda. Uma vez codificado, o sinal ´e processado pela camada de transporte que faz a jun¸c˜ao dos fluxos devidamente codificados e empacotados. Essa jun¸c˜ao chega `a camada de transporte do Terminal de Acesso respons´avel por individualizar as informa¸c˜oes e entregar para o decodificador de v´ıdeo. O decodificador realiza a decodifica¸c˜ao e produz como sa´ıda o sinal de v´ıdeo reconstru´ıdo para que possa ser corretamente exibido [ALENCAR 2007b].
Como podemos ver na Figura 2.6, a codifica¸c˜ao acontece no sentido da esquerda para a direita. Nesse processo, um quadro chega no codificador atrav´es de uma mem´oria interna de entrada. Cada macrobloco pode ser codificado no modo intra ou inter, e depois ele ´e transformado e quantizado. Al´em disso, seus coeficientes s˜ao ordenados e entregues a um codificador de entropia.
Figura 2.6: Diagrama de blocos do codificador H.264 [ALENCAR 2007b]. J´a a reconstru¸c˜ao do v´ıdeo acontece no sentido da direta para a esquerda. Seu objetivo principal prevˆe uma referˆencia dos blocos P (do inglˆes, Predicted) e B
(do inglˆes, Bidirectional) para predi¸c˜oes posteriores pela codifica¸c˜ao, que deve usar os quadros dispon´ıveis no decodificador. Esses coeficientes s˜ao desquantizados e transformados inversamente para produzir aproxima¸c˜oes dos macroblocos residuais na etapa direta da codifica¸c˜ao. Um filtro ´e adicionado para diminuir os efeitos de distor¸c˜ao dos blocos. Uma inova¸c˜ao importante desse filtro ´e que ele ´e adaptativo, conseguindo distinguir as arestas da imagem e do passo elevado de quantiza¸c˜ao [Porto et al. 2005].
O H.264 aproveita alguns detalhes da imagem que n˜ao s˜ao percept´ıveis ao olho humano e, com isso, consegue fazer uma retirada das informa¸c˜oes desnecess´arias. Este formato possui sete perfis e dependendo do perfil, diferentes tipos de quadros - como os quadros I, P e B. A seguir as descri¸c˜oes desses quadros:
• I, Intracoded: ou codificados internamente. S˜ao codificados sem nenhuma dependˆencia com os outros quadros e formam uma imagem completa sendo referˆencia para os quadros P e B. A primeira imagem em uma sequˆencia de v´ıdeo ´e sempre um quadro I, por isso s˜ao usados como pontos de sincroniza¸c˜ao. A desvantagem dos quadros I ´e que eles consomem muito mais bits;
• P, Predicted: Possuem apenas as diferen¸cas que ocorreram em rela¸c˜ao ao qua- dro anterior I ou P. Os quadros P geralmente exigem menos bits do que quadros I. Possuem a desvantagem de serem muito sens´ıveis a erros de transmiss˜ao; • B, Bidirectional ou Bidirecionais: Al´em da diferen¸ca em rela¸c˜ao ao quadro
anterior tamb´em informa a diferen¸ca em rela¸c˜ao ao quadro futuro, oferecendo uma maior compress˜ao.
O padr˜ao MPEG (do inglˆes, Motion Picture Experts Group) tem uma sequˆencia delimitada por dois quadros I e composta por quadros P e B. Nesta configura¸c˜ao os quadros I s˜ao usados como pontos de sincronismo como mostra a Figura 2.7.
Figura 2.7: Organiza¸c˜ao de um GOP. Adaptado de [BECKER e VARGAS 2004]. V´arios m´etodos podem ser aplicados para reduzir os dados de v´ıdeo, em um quadro de imagem ou entre infinitos quadros.
Em um quadro de imagem, os dados podem ser reduzidos simplesmente pela remo¸c˜ao das informa¸c˜oes desnecess´arias que ter˜ao impacto na resolu¸c˜ao da imagem. J´a em uma s´erie de quadros, os dados de v´ıdeo podem ser reduzidos por m´etodos como a codifica¸c˜ao de diferen¸ca.
Al´em do H.264, a maioria dos padr˜oes de compacta¸c˜ao de v´ıdeo tamb´em usa essa codifica¸c˜ao. Imagine uma transmiss˜ao de entrevista na televis˜ao, onde o cen´ario fica est´atico e muda apenas os gestos e a linguagem labial do entrevistador e do entrevistado. Ao inv´es do sistema mandar sempre a mesma informa¸c˜ao que ´e a tela - o cen´ario -, ele informa que ´e para deixar a tela sempre igual e s´o mudar o ponto central. A informa¸c˜ao completa s´o dever´a ser transmitida de novo quando a cena mudar.
Na Figura 2.8, temos um exemplo da codifica¸c˜ao de diferen¸cas. Apenas o primeiro quadro - I - ´e integralmente codificado. Nas duas imagens seguintes - P, s˜ao feitas referˆencias aos elementos est´aticos da primeira imagem, ou seja, o cen´ario. Apenas as partes m´oveis, isto ´e, a apresentadora movimentando o tablet, s˜ao codificadas atrav´es de vetores de movimento, reduzindo, assim, a quantidade de informa¸c˜oes enviadas e armazenadas.
Figura 2.8: Codifica¸c˜ao de diferen¸cas.
No entanto, essa mesma t´ecnica n˜ao se aplicaria se houvesse muito movimento em um v´ıdeo. Por isso, a compensa¸c˜ao de movimento ´e outro aspecto relevante. Algoritmos de compress˜ao de v´ıdeo como o MPEG-2 e o H.264 usam a transformada discreta de cossenos (DCT, do inglˆes, Discrete Cosine Transform) e a predi¸c˜ao interquadros com compensa¸c˜ao de movimentos para os diagramas dos blocos decodificadores e codificadores do H.264/AVC [ALENCAR 2007b].
A predi¸c˜ao intraquadros ´e calculada usando os pixels vizinhos do macrobloco no mesmo quadro e isso envolve algoritmos para explorar de forma eficiente as redun- dˆancias espaciais. A predi¸c˜ao interquadros no H.264 incorpora as seguintes inova¸c˜oes [ALENCAR 2007b]:
• Dimens˜ao de bloco vari´avel para compensa¸c˜ao de movimento; • Referˆencia de quadros m´ultiplos para predi¸c˜ao;
• Uso dos quadros B como referˆencia; • Predi¸c˜ao ponderada;
• Precis˜ao utilizando fra¸c˜oes de pixel.
O padr˜ao H.264 apresenta um grande avan¸co na tecnologia de compacta¸c˜ao de v´ıdeo. Outro aspecto relevante ´e o filtro de antiblocagem, um processo de filtragem que ´e aplicado a cada macrobloco com o intuito de reduzir o aparecimento de ru´ıdos que comprometem a qualidade da imagem.
Esse tratamento suaviza o efeito de bloco do quadro reconstru´ıdo antes dele ser usado para fazer a predi¸c˜ao de um novo macrobloco do tipo inter-quadro.
O objeto de estudo do presente trabalho, a TV Suba´e, adotou o padr˜ao H.264. Com as mudan¸cas previstas no parque tecnol´ogico para implanta¸c˜ao do sinal digital, a emissora adotou as ilhas de edi¸c˜ao Adobe Premier Pro CS6, que tem como vantagens os discos em Raid e o disco do sistema SSD (do inglˆes, Solid State Disk).
O SSD ´e um sistema mais r´apido, com menor aquecimento, consome menos energia, tem maior durabilidade e m´ultiplos processadores, al´em de compress˜ao H.264 como mostra a Figura 2.9.
Figura 2.9: Compress˜ao H.264 adotada na ilha de edi¸c˜ao Adobe Premier.