idrettens samfunnsmessige
3.3 Verdiskift og oppbrudd • mot en ny kroppskultur?
Durante o levantamento de trabalho relacionado sobre modelos de churn (secção 3.3), foram apresentadas algumas formas para a construção de um modelo de churn, em particular, um mo- delo de churn que se aproxime o mais possível da realidade do comportamento dos possíveis utilizadores do LiveFeeds. Seguindo os passos anteriormente estabelecidos no que se refere à construção de modelos de churn, podemos construir um modelo de churn com as caracte- rísticas pretendidas. Neste contexto, considera-se que os utilizadores têm um comportamento semelhante aos utilizadores do skype e de clientes de IM (Instant Messaging), uma vez que o objectivo deste tipo de aplicações é estarem ligadas enquanto o utilizador fica a utilizar o computador, de maneira a receber chamadas, mensagens, ou actualizações nas subscrições.
Para se modelar correctamente o churn na rede LiveFeeds podemos-nos basear em [9, 29], uma vez que nos fornecem informações para a construção deste modelo, estes trabalhos estu- dam dois sistemas em que os utilizadores têm um comportamento análogo ao comportamento que se espera dos utilizadores do LiveFeeds.
De acordo com [9], um modelo de churn para o tipo de sistema considerado é constituído por duas componentes:
1. Uma distribuição que modele o tempo entre duas entradas consecutivas;
2. Uma distribuição que modele o tempo de sessão de cada nó que entra no sistema. Em relação à primeira componente, a distribuição que modela o tempo entre duas entradas consecutivas, sabemos que deve depende da altura do dia e da altura da semana. Para construir este modelo de entrada, deve ser utilizada uma distribuição de Poisson não homogénea [9, 14]. Este tipo de distribuições depende de uma função λ (t), que reflicta o comportamento dos utilizadores consoante a altura do dia e da semana (t). λ (t) pode ser obtido através do
estudo efectuado em [29], com as adaptações devidas, uma vez que esse estudo toma por foco o tráfego IM de uma grande empresa. Além de confirmar a ideia de que as chegadas dos utilizadores podem ser modeladas de acordo com um processo de Poisson não homogéneo, [14] sugere que λ (t) seja uma função que dependa do tempo de uma maneira periódica e tome a forma λ (t) = λ (t + W ) onde W é o período do processo. É desenvolvido este raciocínio para demonstrar que λ (t) deve tomar a forma da expressão (5.1), em que W é igual a uma
semana e a constante de proporcionalidade Nw é o número médio de intervalos de actividade
por semana, as distribuições pd(t) e pw(t) modelam o começo de actividades consoante a altura
do dia (pd(t)) ou da semana (pw(t)).
λ(t) = Nwpd(t)pw(t) (5.1)
Como demonstrado em [14], as distribuições a usar para pd(t) e pw(t) podem ser inferidas
através de dados obtidos através de observações de sistemas semelhantes ao sistema para o qual se quer encontrar um modelo de churn. Estas distribuições representam apenas a probabilidade de começar uma dada actividade a uma dada altura do dia ou da semana, t.
A utilização de uma distribuição de Poisson não homogénea foi equacionada para que se modelasse correctamente o facto de os utilizadores terem diferentes comportamentos depen- dendo da altura do dia e da semana em consideração, no entanto como se pretende estudar o comportamento do algoritmo perante o pior caso possível, na altura pior do pior dia da se- mana. É então possível fazer uma simplificação do modelo de churn, através do uso de uma distribuição de Poisson homogénea que represente o pior caso do com que o sistema LiveFeeds tem de suportar. Com base em trabalhos relacionados, essa distribuição foi calibrada e foram executadas algumas simulações com diferentes valores de r, o número de eventos de entrada e saída por segundo. Uma vez que a distribuição homogénea de Poisson aceita um parâmetro λ , esse parâmetro foi modificado em função do r pretendido, considerando λchegada= 1/r, pois
a distribuição modela o tempo entre chegadas consecutivas e assim um valor esperado de 1/r segundos entre chegadas corresponde a um valor esperado de r chegadas por segundo. Para que exista uma maior granularidade, o valor de λchegadasé utilizado em centésimos de segundo,
por exemplo, se o pretendido for um valor esperado de 4 chegadas por segundo, λchegadasdeve
ser igual a 1/r × 100 = 1/4 × 100 = 25. A figura 5.1 mostra o aspecto da função densidade de
probabilidade de uma distribuição de Poisson homogénea parametrizada com λchegadas= 25.
Para finalizar a construção do modelo de churn do LiveFeeds, deve ser encontrado uma outra distribuição que modele correctamente tempo de permanência na rede de um nó que entra na rede.
O tempo de permanência dos nós na rede segue uma distribuição heavy-tailed [9, 29]. Em [29] é desenhado um gráfico da Comulative Distribution Function do tempo de permanência dos nós na rede. Seguindo a proposta sobre a utilização de uma distribuição heavy-tailed,
0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0 10 20 30 40 50 P
Tempo entre chegadas consecutivas (centésimos de segundo)
Função densidade de probabilidade de uma distribuição de Poisson com λ = 25
Figura 5.1: Gráfico da função densidade de probabilidade para o tempo entre chegadas conse-
cutivas, modelado por um processo de Poisson homogéneo com λchegadas= 25 o que equivale
a um valor esperado de 25 centésimos de segundo.
podemos utilizar uma distribuição de Weibull para modelar o tempo de permanência dos nós na rede [29] e de seguida construir um modelo de churn.
A distribuição de Weibull é definida por dois parâmetros, λsessao1e k, que podem ser obtidos
a partir de [29]. Foram obtidos por observação dos gráficos desse trabalho, os valores de λsessao= 5 × 103e k = 0.5. Além desta observação dos gráficos, foi tido em conta o que estes parâmetros representam no contexto da distribuição de Weibull. O parâmetro k representa a taxa de “mortalidade infantil” dos nós, ou seja, a taxa de nós que está na rede durante muito pouco tempo. Foi definida uma taxa de 0.5 por ser o valor mais consistente com [29].
Obtivemos assim os componentes necessários para podermos construir um modelo de churn para o LiveFeeds. Esse modelo é composto pelo modelo de entradas de utilizadores, descrito
por um processo de Poisson homogéneo, com parâmetro λchegadase pelo modelo de tempo de
permanência dos utilizadores na rede, que é representado por uma distribuição de Weibull com parâmetros λsessaoe k.