Considerando que assistir e comentar um vídeo com outra pessoa é uma prática com a qual muitas pessoas já estão acostumadas, foi proposto, e é resultado desta tese, o paradigma watch-and-comment (WaC) (Pimentel et al., 2007c, 2008c; Cattelan et al., 2008a), para produção e edição transparentes de vídeo digital interativo. A premissa básica em que se fundamenta o paradig- ma é a de que, enquanto um usuário assiste a um vídeo, qualquer interação natural entre o usuário e a mídia (por exemplo, um comentário por voz) pode ser automaticamente capturada e registrada em um vídeo digital interativo es- pecificado por meio de um documento em linguagem declarativa (por exemplo, um documento descrito em SMIL (W3C, 2008) ou NCL (Silva et al., 2004)). O período durante o qual ocorre tal interação é aqui definido e referenciado como uma sessão watch-and-comment.
O paradigma WaC pode ser amplamente explorado em cenários de TV in- terativa, por exemplo em situações em que controles remotos de última ge-
ração estejam disponíveis — como nas situações investigadas por Tsekleves et al. (2007) e por Bulterman et al. (2006). No primeiro caso, os autores investigam protótipos para acessar e controlar a TV. No segundo caso, os au- tores investigam uma arquitetura inovadora para enriquecimento de conteúdo pelo telespectador, também considerando a disponibilidade de uma tela se- cundária (César et al., 2008).
Tais idéias foram previamente exploradas com a definição (Pimentel et al., 2007c) e a demonstração (Pimentel et al., 2008c) do paradigma WaC. O pro-
tótipo original, a ferramenta WACTOOL (Cattelan et al., 2008a), permite a cap-
tura de comentários feitos por meio de tinta digital, voz e texto sobre quadros individuais e segmentos de vídeo, produzindo como resultado um documento NCL que sincroniza os diferentes fluxos de mídia correspondentes. A lin- guagem NCL (Nested Context Language) é o padrão do SBTVD para programas declativos interativos e permite especificar, de forma estruturada, documentos hipermídia complexos contendo relacionamentos de sincronização temporal e espacial entre seus componentes.
Uma característica importante dessa abordagem, do ponto de vista da gestão de direitos autorais, é que as edições e anotações feitas posteriormente são mantidas separadas do fluxo de vídeo a que se referem, o que significa que as mesmas podem ser distribuídas independentemente da mídia original.
Pesquisadores têm investigado o problema de se permitir a edição de do- cumentos multimídia para TV interativa tanto do lado do cliente (César et al., 2006b) quanto do lado do servidor (Costa et al., 2006). Do lado do servidor, a edição ao vivo é necessária em situações em que nem toda informação a ser exibida pôde ser definida no momento da autoria — isto é, antes da trans- missão por difusão (broadcast) no lado do servidor (Costa et al., 2006). No lado do cliente, as motivações incluem permitir que um usuário compartilhe o conteúdo com um ou mais membros de um grupo (César et al., 2006b) ou, em uma abordagem mais genérica, que o usuário explore um tela secundária para ajudar outros usuários nas tarefas de controlar, enriquecer, compartilhar e transferir conteúdo de TV interativa (César et al., 2008). Considerando tra- balhos de pesquisa relacionados, o paradigma WaC traz contribuições comple- mentares relativas à edição de vídeo digital interativo pelo usuário-fnal, bem como aspectos de colaboração e TV social.
A proposta original do paradigma WaC também foi estendida de outras maneiras. As interações do usuário com o fluxo de vídeo sendo exibido foram associadas com comandos de edição (loop, seek, skip e slow motion) — com o objetivo de demonstrar aos usuários a oportunidade de autoria transparente de vídeo interativo considerando essas opções convencionais de edição.
Princípios de Projeto. A base para paradigma WaC é a captura ubíqua da interação multimodal do usuário com o fluxo de vídeo sendo exibido para gerar conteúdo interativo. Essa abordagem é genérica, de acordo com os seguintes princípios:
• Não há restrição com respeito à fonte de vídeo: o fluxo de mídia pode ser obtido ao vivo a partir de uma câmera, por difusão do sinal de TV, ou reproduzido de um arquivo armazenado localmente no computador, conversor digital (set-top box) ou reprodutor de mídia (media player). • Não há restrição com respeito ao tipo do vídeo: por exemplo, um fluxo de
vídeo pode ser gerado a partir de um conjunto de imagens.
• Não há restrição com respeito à linguagem do documento resultante: por exemplo, NCL, SMIL ou qualquer outra linguagem declarativa para auto- ria hipermídia pode ser utilizada.
• Uma sessão WaC pode ser colaborativa, distribuída e síncrona: mais de um usuário (localizado remota ou localmente) pode colaborar simultane- amente em uma sessão para anotação de um mesmo vídeo.
• O documento declarativo gerado mantém as anotações em separado da mí-
dia original: isto significa que as anotações e edições podem ser distribuí-
das independentemente da mídia original — o que é uma característica importante quando se faz alusão à questão de direitos autorais.
• Não há restrição com respeito à mídia utilizada para os comentários: tão logo tal mídia possa ser capturada. A captura pode ser transparente sob a perspectiva do usuário (por exemplo, voz capturada com um microfone, tinta digital de dispositivos com interface com caneta eletrônica, gestos capturados com sensores como os acelerômetros presentes no Wii Re-
mote4 ou no iPhone5). A captura pode ser explícita, por exemplo palavras
digitadas em um teclado e ações realizadas para produzir algum resul- tado (como é o caso de um clique na janela de vídeo para indicar o início ou o fim de um segmento de vídeo selecionado), ou implícita, por ex- emplo se comentários de voz forem ativados automaticamente quando o microfone detecta que o usuário está falando.
• Não há restrição com respeito em como a captura da interação deva ser
utilizada: o que significa que as aplicações podem inovar em termos do
4http://www.nintendo.com/wii/what/accessories, acesso em 15/03/2009. 5http://www.apple.com/ipodtouch, acesso em 15/03/2009.
que fazer com a interação capturada. Por um lado, uma interação de um usuário em particular pode ser associada a qualquer comando no vídeo interativo resultante (por exemplo, em um comando de edição skip). Nesse caso, quando o vídeo interativo resultante é posteriormente revisto, o comando correspondente é oferecido ao usuário como uma opção (isto é, o usuário decide se quer ou não saltar o trecho de vídeo indicado). Por outro lado, o fato do vídeo resultante ser interativo também é uma opção: todas as interações capturadas durante uma sessão watch-and-
commentpodem ser interpretadas como comandos associados com edições
obrigatórias — e o resultado seria a produção de vídeo não-interativo. • Não há restrição com respeito a como o documento declarativo resultante
é distribuído: significando que o vídeo interativo pode ser armazenado e reproduzido apenas no dispositivo em que foi capturado (por exemplo, no caso do usuário possuir um controle remoto de última geração), ou que exista um integração do ambiente do usuário com um repositório Web
como o YouTube6 ou o AsterPix,7 por exemplo.
• Uma sessão WaC pode ser inicializada a partir de um documento declara- tivo: usuários podem “assistir e comentar” tanto um vídeo linear quanto um vídeo interativo, o que requer que a ferramenta de anotação inclua
parsers para o formato correspondente — como é o caso do Ambulant
Annotator (César et al., 2006a) e do NCL Composer (Guimarães et al., 2008).
Os princípios descritos salientam quão genérica é a abordagem — o pro- tótipo apresentado na seção seguinte ilustra algumas das muitas possibili- dades de uso e aplicação do paradigma WaC no contexto mais amplo de TV digital, e de autoria de vídeo interativo pelo usuário-final, em particular.