3. Methods
3.7. Cell culture and flow cytometry
Para atingir o objetivo proposto, os estados brasileiros foram agrupados segundo indicadores relacionados com o a distribuição de EDOs utilizando análise de cluster. A análise de agrupamentos é uma técnica multivariada que utiliza algoritmos para reunir em aglomerados ou clusters dados relacionados entre si, através de medidas e suas relações de proximidades (ou similaridade), separando tais grupos segundo suas distâncias (ou dissimilaridades). É um método taxonômico estatístico (CÂMARA, 2008).
Este tipo de procedimento não é um teste estatístico, pois não parte de uma hipótese a priori, e se ela existe deve ser ignorada. De fato, a análise de cluster situa-se na fase onde a pesquisa ainda é exploratória e busca-se compreender como os dados se agrupam, e então
83
estabelecer uma hipótese plausível, ou simplesmente usar os resultados como uma orientação para o curso do experimento. Entretanto, ela é essencialmente uma técnica classificatória e como tal tem seu maior uso (CÂMARA, 2008).
A análise de cluster permite identificar grupos compostos por estados que possuam algumas particularidades em comum em relação à distribuição dos EDOs. Esta análise estatística é importante para compreensão da realidade do cenário brasileiro no que se refere à gestão da distribuição de Tecnologias em Saúde voltadas para o diagnóstico da osteoporose.
Para Kasznar e Gonçalves (2014), a análise de Cluster ou agrupamento é realizado a partir de similaridades ou distâncias entre seus componentes (dissimilaridades). Os únicos pré-requisitos são medidas de similaridade ou dados sob os quais possam ser calculadas similaridades. Devem ser ativadas considerações importantes como a natureza das variáveis (discreta, contínua, binária), as escalas de medida (nominal, ordinal, intervalo, quosciente) e o conhecimento específico do assunto em tela. Quando itens (unidades ou casos) são clusterizados, proximidade é indicada por algum tipo de distância. Por outro lado, as variáveis são agrupadas baseadas no seu coeficiente de correlação ou outras medidas estatísticas de associação.
Há dois métodos gerais de análise de clusters: por agrupamento hierárquico e por agrupamento não hierárquico.
Os métodos não-hierárquicos, ou por particionamento, foram desenvolvidos para agrupar elementos em K grupos, onde K é a quantidade de grupos definida previamente. Não são todos os valores de k que apresentam grupos satisfatórios, sendo assim, aplica-se o método várias vezes para diferentes valores de K, escolhendo os resultados que apresentem melhor interpretação dos grupos (BUSSAB, 1990). Os métodos por particionamento mais conhecidos são o método k-means e o método k-medoid (DONI, 2004).
No presente estudo, foi empregado o método hierárquico. Os algoritmos hierárquicos criam uma hierarquia de relacionamentos entre os elementos. Eles são muito populares na área de bioinformática e funcionam muito bem, apesar de não terem nenhuma justificativa teórica baseada em estatística ou teoria da informação. Existem duas versões: a aglomerativa, que opera criando conjuntos a partir de elementos isolados, e a divisiva, que
84
começa com um grande conjunto e vai quebrando-o em partes até chegar a elementos isolados (LINDEN, 2009).
Utilizou-se, nesta pesquisa, a versão aglomerativa, onde cada elemento inicia-se representando um grupo, e a cada passo, um grupo ou elemento é ligado a outro de acordo com sua similaridade, até o último passo, onde é formado um grupo único com todos os elementos (ANDERBERG, 1973). Existe uma variedade de métodos aglomerativos, que são caracterizados de acordo com o critério utilizado para definir as distâncias entre grupos (DONI, 2004). Os principais métodos são: método Single Linkage ou ligação por vizinho mais próximo; método Complete Linkage ou ligação por vizinho mais distante; método Average Linkage ou ligação por média; método Centroid Linkage ou ligação por centroide; método Median Linkage ou ligação por mediana; e finalmente, o método de ligação de Ward.
Para melhor desenvolvimento deste trabalho, foi escolhido o método de ligação de Ward. Este método apresenta bons resultados tanto para distâncias euclidianas quanto para outras distâncias, mas pode apresentar resultados insatisfatórios por: exibir dificuldades no trabalho com grupos que possuam número de elementos praticamente iguais e ter tendência a combinar grupos com poucos elementos. O Método de Ward tem como enfoque a variabilidade entre os grupos. Os agrupamentos são construídos considerando-se a variância mínima. Assim, o método de Ward gera grupos que possuam uma alta homogeneidade interna. Este método permitirá identificar localidades territoriais do Brasil que possuam distribuição do EDO semelhantes e ainda apontar vulnerabilidades tendo em vista o que está previsto na legislação
A maioria dos métodos de análise de cluster requer uma medida de similaridade entre os elementos a serem agrupados, normalmente medida é expressa como uma função distância ou métrica. As principais medidas de similaridade são: distância Euclidiana, distância Euclidiana Quadrática, distância de Manhattan, distância de Chebyche. Neste estudo utilizou-se o intervalo de distância euclidiana quadrada, que é simplesmente a distância geométrica no espaço multidimensional, ou seja, a distância entre dois pontos, que pode ser provada pela aplicação repetida do teorema de Pitágoras. Aplicando essa fórmula como distância, o espaço euclidiano torna-se um espaço métrico
85
As análises estatísticas foram realizadas a partir do aplicativo Statistical Package for the Social Sciences - SPSS®
Para a análise de agrupamentos, foram consideradas as seguintes variáveis:
Participação relativa (%) da população feminina com idade de 65 anos ou mais e homens com 70 anos ou mais em relação ao total da população;
IDH;
Porcentagem de EDOs disponíveis no SUS. Este cálculo foi obtido através da divisão entre a quantidade total de equipamentos em uso geral e a quantidade total de equipamentos em uso no SUS por região e UF;
Taxa de EDO do SUS para cada 140 mil pessoas. Indicador construído com base nas recomendações da Portaria do MS n.º 1101/GM de 2002;
Porcentagem de municípios das Unidades da Federação (UFs) que possuem o EDO. Cálculo obtido através da divisão entre o número de municípios da UF que possuem o EDO e o número total de municípios da UF;
Taxa de EDO do SUS para cada 140 mil idosos. Este indicador foi construído com base na quantidade de EDO dividido pela população idosa, considerando a faixa etária eatabelecida pela portaria do MS nº 470 de 24 de julho de 2002.
86