DEL I: PERSPEKTIVER
4.3 Analytiske prosedyrer
4.3.1 Interaksjonsanalyse
O sistema educacional de uma universidade norte-americana foi caracterizado em [63]. Foram encontradas distribuições para duração de sessões (sessão é uma seqüência de requi- sições de um usuário a uma mesma mídia), duração de requisições e duração dos períodos de inatividade entre requisições. Também foi calculada a freqüência de operações de saltos e encontrando-se alguma localidade de acesso.
Acessos a vídeos de baixa resolução de um sistema educacional são avaliados em [41]. São obtidas distribuições para a duração de requisições e para os tempos de inatividade entre requisições. A avaliação dos saltos também indica alguma localidade de acesso.
A heterogeneidade do conteúdo de mídia contínua foi avaliada em [2], que identificou a presença de vídeos de duração e taxa de codificação variada nos acessos a um servidor de mídia contínua de uma universidade européia, além de uma forma simples de interatividade, a que chamou de acesso parcial. Nessa situação o vídeo á acessado a partir de sua posição inicial,
Client Server Start position ON time OFF time Jump Distance
OFF time > threshold or request to another file terminates session
Interactive requests within session 1 Interactive requests within session 2 Start position User Interaction
Figura 2.6: Modelo hierárquico do comportamento de clientes. Fonte: [25]
mas tem sua exibição interrompida. Avaliou-se também nesse estudo a popularidade de vídeos, verificando-se que um vídeo acessado recentemente tem alta probabilidade de ser acessado novamente em breve. A popularidade dos vídeos avaliados seguiu a distribuição Zipf [85].
Os acessos a serviços de mídia contínua feitos a partir de uma universidade norte-americana foram registrados e analisados em [21]. Ao medir características das sessões que acessam os mesmos arquivos, esse estudo identificou alta localidade temporal entre elas e concluiu que, para a carga em questão, seria proveitoso usar técnicas de compartilhamento de fluxos, com grande economia de banda.
A carga de sistemas educacionais de duas universidades norte-americanas foi usada em [5] para uma análise detalhada da interatividade, considerando-se um conjunto de requisições de um usuário a uma mesma mídia como uma sessão. Dentre diversos outros aspectos, tais como tamanho de arquivos, popularidade de arquivos e taxas de codificação, foram avaliadas as distri- buições para tempo entre chegadas de requisições, duração de requisições e duração de períodos inativos entre requisições. Também foram avaliados quantidade de requisições interativas por sessão e percentuais de requisições interativas (pausa, saltos para a frente, saltos para trás). Identificaram-se diferentes padrões de acesso que variaram com a duração e a popularidade da mídia. Diferentemente de trabalhos anteriores, [5] identificou que a popularidade de arquivos é mais bem modelada pela concatenação de duas distribuições Zipf.
Análise de carga oriunda de uma empresa privada é feita em [19]. Esse trabalho concentra- se mais na análise da dinâmica de longo prazo do acesso a arquivos de mídia, ou seja, preocupa- se mais em avaliar como a popularidade de uma mídia varia com o tempo do que em analisar detalhadamente características tais como duração de sessões, acesso parcial ou localidade de referência. Essa mesma abordagem é retomada em [20].
2.2 Cargas interativas de mídia contínua 36
tes na literatura, englobando diversos domínios de aplicação, foi efetuada em [25]. Diferente- mente de trabalhos anteriores, essa caracterização não se ateve a cargas restritas ou específicas mas tratou de cargas de vídeo educacional, vídeo de entretenimento e áudio de entretenimento. Usou, também, cargas significativamente mais extensas que as usadas em caracterizações ante- riores, cobrindo diversos perfis de interatividade. Avaliando diversos parâmetros das cargas e, especificamente, das sessões de usuários, identificou perfis de comportamento interativo típicos dos diversos tipos de cargas, de sorte que as características de uma sessão variam conforme o perfil. Verificou forte localidade de acesso em uma sessão, com a predominância de saltos curtos. Também identificou a existência de períodos de inatividade relativamente longos entre as requisições de uma sessão, se comparados à duração das requisições. Esse mesmo trabalho ainda pesquisou correlações entre os tipos de requisição interativa de uma sessão verificando que o tipo de uma requisição depende fortemente do tipo da requisição imediatamente anterior a ela.
A presente tese faz uso do modelo hierárquico de comportamento de clientes proposto em [25] e que é apresentado na figura 2.6. Esse modelo tem, num nível mais alto, uma sessão de cliente, que é quebrada, num nível inferior, em uma seqüência de requisições (ou ações) interativas. A sessão inicia-se com uma requisição que solicita a recuperação de um segmento do arquivo de mídia, a partir de uma certa posição inicial (start position). A requisição tem uma certa duração (ON time, ou período ativo), e, após a requisição ser atendida (ou interrompida), transcorre um tempo de inatividade (OFF time, ou período inativo) até o início da próxima requisição. A próxima requisição é disparada por uma ação interativa do usuário (reiniciar após uma pausa, efetuar um salto para a frente ou para trás, por exemplo). Uma sessão consiste numa série de requisições de acesso a uma mesma mídia e termina quando o cliente efetua uma requisição de acesso a outra mídia, ou após um certo período de inatividade.
Num estudo feito com carga coletada de diversos provedores de conteúdo sediados em um grande provedor de hospedagem, os autores de [40] fazem uma quantificação da perda de banda ocorrida em servidores de conteúdo que oferecem arquivos para download de mídia (em lugar de oferecer serviços de mídia contínua). Os autores indicam que a perda ocorre porque freqüentemente um usuário é levado a receber toda uma mídia apenas para examinar parte do conteúdo, processo que seria mais efetivo no caso de um serviço de mídia contínua.
Uma caracterização de grande volume de usuários de um serviço comercial de vídeo sob demanda é feita em [83]. Contudo, essa caracterização se volta mais para aspectos de longo prazo e para a popularidade de mídias, numa abordagem similar à de [19, 20].
de uma universidade norte-americana [79]. Avaliando características das sessões dos usuários e os parâmetros das sessões interativas, essa análise buscou encontrar correlações entre esses parâmetros. Identificou-se uma correlação entre a posição inicial de uma requisição e sua dura- ção, verificando-se também alta localidade de acesso nos saltos. Essa caracterização foi usada como base para a criação de um modelo da carga e para a síntese de carga a partir desse modelo. Por fim, [7] faz a caracterização da carga de um sistema educacional brasileiro, que usa o servidor de vídeo RIO [60], um servidor de mídia contínua baseado em acesso aleatório [70]. Assim como em trabalhos anteriores, foram verificadas uma alta localidade de acesso em saltos e uma forte interatividade por parte dos usuários, conforme se poderia esperar em um servidor de vídeos educacionais.