• No results found

3 Oversikt over status og utfordringer

3.5 Vurdering av tilstand

Quando resumimos dados com medidas de tendência central sempre perdemos informações sobre o conjunto todo. Para contornar tal perda, precisamos considerar as medidas de dispersão. Segundo Ben-Zvi e Garfield (2008, p 203), “é difícil imaginar o resumo de um conjunto de dados usando apenas uma medida de centro ou usando apenas uma medida de dispersão.” Assim, não faz

sentido abordar uma e ignorar a outra. Os autores propõem que no processo de construção do conceito de média, por exemplo, já se aborde esta medida como um ponto de equilíbrio na distribuição dos dados, permitindo que o aluno perceba a variação dos valores em torno dela. A ideia de desvio em torno da média já prepara o estudante para a compreensão das medidas de variação como desvio-padrão, por exemplo, o que será explicado a seguir.

Amplitude

A amplitude é uma medida de variação obtida pela diferença entre os valores máximo e mínimo. Tem a vantagem de ser uma medida de fácil compreensão e rápida obtenção, permitindo uma primeira análise da dispersão em relação à média ou à mediana. Sua limitação é o fato de considerar apenas dois elementos do conjunto de dados.

Desvio-Médio

O desvio-médio é uma medida de dispersão obtida pela média dos valores absolutos dos desvios de cada valor em relação à média de todos os valores.

n x DM n i i

   1 | | 

Na expressão, DM corresponde ao desvio-médio, xi cada dado, µ a média

e n a quantidade de elementos do conjunto.

A vantagem do desvio-médio em relação à amplitude é que seu algoritmo leva em conta todos os dados que estão sendo analisados, sendo, portanto, mais representativa dos mesmos. Quando comparado ao desvio-padrão, ele tem o benefício de ser mais intuitivo, pois é a média dos desvios absolutos, ou seja, toma estes desvios |xi| no sentido de “distância euclidiana”, já trabalhada com os alunos nas aulas de Geometria. Mas, tem a desvantagem de utilizar a função

módulo que, “por suas características matemáticas, torna mais difícil o estudo de suas propriedades”. (LIMA e MAGALHÃES, 2004, p.104).

Variância

A variância é uma medida-resumo de dispersão obtida pela média dos quadrados dos desvios de cada valor de um conjunto de dados em relação à média dos próprios valores.

n x Var n i i

   1 2 ) ( 

Quando se trata de amostra, a variância é obtida:

1 ) ( 1 2   

N x x Var n i i

Nas expressões, Var corresponde à variância, xi cada valor fornecido, µ à

média populacional, x à média amostral, n à quantidade de elementos do conjunto e

N à quantidade de elementos da amostra.

Um inconveniente para a atribuição de significado à variância vem do fato dela ser representada por uma unidade de medida diferente dos dados originais, dificultando assim sua interpretação. Por exemplo, se os dados são expressos em centímetros, a variância será dada em centímetros quadrados. Resolve-se este problema cognitivo extraindo a raiz quadrada da variância, que é denominada desvio-padrão.

Desvio-Padrão

Desvio-padrão é a raiz quadrada da variância.

n x DP n i i

   1 2 ) (  ou 1 ) ( 1 2   

N x x DP n i i

Reading; Shaughnessy (2004) afirmam que a complexidade dos cálculos do desvio-padrão é um obstáculo, para que o professor possa motivar os alunos para tal medida, pois ela exige que o estudante mobilize diversos conceitos como média, desvio, potência, raiz quadrada e fração. A compreensão desta medida não é intuitiva, e é difícil interpretá-la, pois é de natureza complexa, apesar de ser a medida de variação mais comumente utilizada.

A pesquisa de Meletiou (2000) também confirma esta constatação, pois dentre as medidas de dispersão trabalhadas pela autora, o desvio-padrão foi a que os alunos apresentaram maior dificuldade. Da mesma forma, Ben-Zvi e Galfield (2008) afirmam que, normalmente, o alunos aprendem a definição do desvio-padrão e como ele é calculado, mas raramente entendem de modo claro o significado desta medida e como interpretá-la.

Quando se pretende construir um conceito, é preciso ir além das fórmulas, dos cálculos e dos exercícios de aplicação de procedimentos, sendo indispensável dar ênfase ao significado do conceito visado. Para tal compreensão, DelMas e Liu (2005) conjecturam ser necessária a coordenação de outros conceitos estatísticos subjacentes, a partir dos quais o desvio-padrão é construído, ou seja, é preciso mobilizar a noção de distribuição, de média e de desvio em torno da média.

O conceito de distribuição requer a mobilização dos valores assumidos pela variável e de suas frequências. Portanto, a visualização gráfica facilita a compreensão da distribuição. É importante entender a média como um ponto de equilíbrio entre os dados e, finalmente, perceber os desvios de cada dado em relação à essa medida. Desta forma, notamos a importância de se trabalhar a visualização dos dados em representações gráficas e a exploração do significado da média, para a abordagem do desvio-padrão.

Conforme relata Meletiou (2000), muitos alunos associam variabilidade com variedade, com multiplicidade de valores, com diferença entre os dados, etc. Silva (2007) pesquisou livros didáticos e identificou que quase todos os analisados sugerem a interpretação do desvio-padrão, como uma medida de homogeneidade do grupo. Segundo Loosen, Lioen e Lacante (1985 apud Silva, 2007, p. 116) “os livros didáticos enfatizam a heterogeneidade entre as observações e não a heterogeneidade em relação à tendência central”.

A média é essencial na definição do desvio-padrão e quando abordamos a variação, estamos preocupados em estudar uma determinada medida-resumo em torno da qual existe ou não variação. Portanto, interpretar desvio-padrão como homogeneidade/heterogeneidade, concentração/dispersão sem se referir ao valor em torno do qual ocorre a variação, pode levar os alunos a interpretações equivocadas das medidas de variação.

O exemplo da figura 4 ilustra esta situação:

Quais gráficos representam os dados com menor desvio-padrão?

Gráfico 1: concentração nos extremos Gráfico 2: homogêneo

Gráfico 3: heterogêneo Gráfico 4: heterogêneo com maior concentração em torno da média

Figura 4 - Relação entre distribuição e variação dos dados

Se associarmos o valor do desvio-padrão, apenas com uma distribuição de maior ou menor concentração, o aluno poderá ser induzido a achar que os dados do Gráfico 1 da figura 4 possuem a menor dispersão, pois os dados possuem grande concentração nos extremos. Se relacionarmos o valor do desvio-padrão com homogeneidade entre os dados, os alunos serão induzidos a achar que o Gráfico 2 representa a menor variação e o Gráfico 3 a maior. Todavia, se relacionarmos a concentração, a homogeneidade com a dispersão dos dados em relação à média, eles terão mais chances de perceber que o menor desvio-padrão será encontrado nos dados representados pelo Gráfico 4.

Silva conclui seu trabalho mostrando que a percepção da variação entre os dados e não em relação a uma medida de tendência central, dificulta a construção de um raciocínio mais elaborado sobre variação:

[...] a utilização do termo variação levou alguns professores a perceber a variação entre as frequências de uma mesma categoria e escolher a categoria cujas frequências eram mais uniformes, ou seja, apresentavam menor variação entre elas, o que não faz sentido na análise de dados [...].

(SILVA, 2007, p.321).

Intervalo interquartil

O intervalo interquartil é uma medida-resumo de dispersão obtida pela diferença entre o terceiro (Q3) e o primeiro quartil (Q1). Este intervalo abarca 50% dos dados observados.

Segundo Bussab; Morettin (2005), o desvio-padrão e a média têm o inconveniente de serem medidas influenciadas por valores extremos. Por outro lado, o intervalo interquartil tem a vantagem de ser uma medida de dispersão robusta que não sofre tais influências, pois depende da posição ocupada pelos dados ordenados e não de seus valores. Enquanto o intervalo interquartil tem o benefício de ser uma medida robusta, ele tem a desvantagem de não considerar todos os dados. Assim, cabe ao pesquisador decidir qual medida é mais conveniente em cada caso. Logo, os alunos precisam construir um conjunto de conhecimentos que lhes permita tomar tal tipo de decisão.