Nesta Seção, será apresentado o procedimento para seleção das comunidades, bem como o processo adotado para coletar os dados referentes à rede de relacionamentos dos membros associados às mesmas.
3.1.2.1 Seleção das Comunidades
Para localizarmos as comunidades de interesse, foi utilizado o recurso do Orkut que permite pesquisar por funcionalidades e conteúdo dessa rede social através da consulta por palavras chave. Como nossa análise focava em usuários surdos, nossa seleção iniciou por esse grupo de usuários.
A identificação de comunidades destinadas a surdos foi realizada através da busca por termos como “Surdo”, “Surdos” e “Surda”. A partir dos resultados retornados, aplicamos os seguintes critérios de seleção: (1) Selecionar comunidades declarativas cujo nome e descrição indicassem que seus membros eram surdos do Brasil; e (2) Todas as comunidades selecionadas deveriam respeitar o mesmo intervalo de membros associados.
Em relação ao intervalo de membros associados às comunidades, foi necessário limitá-lo entre 100 e 500 devido as seguintes restrições:
• Orkut não exibe o perfil de todos os usuários de comunidades que possuem mais de 1000 membros associados. Como a metodologia para coleta dos dados desses membros se baseava na navegação e visualização dos membros do website, foi necessário analisar comunidades que tinham menos de 1000 usuários associados; • Durante nossa busca, considerando a primeira restrição, a maior amostra de comunidades destinadas a reunir usuários surdos, que explicitavam essa
3.1. Metodologia para Caraterização da Rede de Relacionamentos
Online dos Usuários Surdos 31
informação claramente no nome e na descrição da comunidade, contemplava uma faixa de 100 a 500 usuários associados;
• Diante da necessidade de comparar a rede de relacionamentos online de surdos e ouvintes e uma vez que as comunidades destinadas a surdos foram as primeiras a serem selecionadas, contemplando essa faixa de usuários associados, as demais deveriam conter um intervalo de número de membros similar.
A partir dos critérios e restrições descritos acima, quatorze comunidades destinadas, explicitamente, a reunir usuários surdos do Brasil foram selecionadas. A seguir, para exemplificar, detalhamos na Figura 3.1 o perfil de uma das comunidades selecionadas.
Figura 3.1. Dados de uma das comunidades selecionadas para análise da rede de relacionamentos online dos usuários surdos
As comunidades destinadas a reunir homossexuais e pessoas com o mesmo sobrenome, também foram selecionadas a partir dos critérios descritos anteriormente, no entanto os termos utilizados para busca foram respectivamente palavras como: homossexual e sobrenomes (e.g., Rodrigues e Prates). Foi possível detectar seis comunidades declarativas cujo objetivo era conectar homossexuais (e.g., “Eu sou Homossexual”) e outras seis comunidades destinadas a reunir pessoas com o mesmo sobrenome (e.g., “Família Rodrigues”). Todas as comunidades respeitavam um intervalo de 100 a 500 membros.
A seleção das comunidades aleatórias, por sua vez, ocorreu a partir do sorteio de palavras que deveriam estar presentes nos nomes das mesmas. Nesse processo, depois de sortear uma palavra utilizando a ferramenta “Random Word Generator”1
e traduzi- la para o Português, uma busca por comunidade no Orkut era realizada onde o termo de pesquisa consistia na palavra sorteada. Em seguida, selecionávamos a primeira comunidade encontrada cujo número de membros fosse equivalente ao intervalo estabelecido para as demais. Este processo se repetiu até que nove comunidades aleatórias foram selecionadas.
No total foram selecionadas 35 comunidades, agrupadas em quatro categorias (i.e., Surdos, Homossexuais, Famílias e Aleatórias). A quantidade de membros presentes nas
1
mesmas variou entre 100 e 500 e todas possuíam mais de quatro anos de existência. A Figura 3.2, lista o nome das comunidades analisadas.
Figura 3.2. Comunidades selecionadas para análise
3.1.2.2 Coleta da Rede de Relacionamento dos Membros das Comunidades Uma vez definidas as comunidades, o próximo passo da nossa metodologia consistiu em coletar as informações relacionadas ao perfil e a rede de relacionamentos de cada usuário membro das comunidades selecionadas.
O Orkut não disponibiliza uma interface de programação da aplicação (do inglês, Application programming interface (API)) para a coleta de seus dados. Diante disso, para obtermos os dados de interesse desenvolvemos um coletor automático de páginas HTML. Esse coletor recuperava o HTML de uma página web e posteriormente
3.1. Metodologia para Caraterização da Rede de Relacionamentos
Online dos Usuários Surdos 33
processava o texto contido na mesma. A seguir o Algoritmo 1 escreve os passos executados durante a coleta.
Algoritmo 1 Coleta de Usuários das Comunidades do Orkut Require: ComunidadeColeta
Ensure: U suariosEAmigos
1: U suariosDaComunidade ⇐ D Coletar Usuario da Comunidade
ComunidadeColeta
2: for all Usuario ∈ UsuariosDaComunidade do
3: Amigos ⇐ Coletar Rede de Relacionamento do Usuario
4: U suariosEAmigos ⇐ U suariosEAmigos ∪ <Usuario, Amigos>
5: end for
Para cada um dos membros das comunidades selecionadas coletamos informações como: número identificador no Orkut (id), nome, quantidade de amigos no Orkut, bem como os ids e nomes de todos os amigos desse usuário. Para todos os usuários que mantinham uma relação de amizade, criamos uma conexão entre eles. Considerando que um mesmo usuário poderia estabelecer amizade com dois ou mais membros de uma comunidade, cuidamos para que seu perfil fosse coletado apenas uma vez, no entanto, todas as suas conexões foram consideradas.
Os dados foram extraídos no período de aproximadamente um mês, entre 16 de outubro a 20 de novembro de 2010. Utilizamos um servidor de banco de dados e doze máquinas Linux. Ao todo, foram coletados os perfis e a rede de amizades de 10.957 membros, distribuídos nas 35 comunidades descritas anteriormente. Na próxima subseção descrevemos como os dados obtidos foram analisados.