Veien videre - Sosioøkonomisk bakgrunn og leseferdigheter : En kvantitativ undersøkelse av samm

A estatística compreende a área do conhecimento que se encarrega da coleta e tratamento de dados com o objetivo de, a partir destes, fornecer informações sobre uma população de interesse. Tais informações possibilitam ao pesquisador conhecer aspectos específicos relacionados a esta população, que servirão de base para a tomada de decisão acerca dos mais variados problemas, pertinentes a diferentes campos de conhecimento (ARANGO, 2009).

Assim, essa ciência funciona como uma valiosa ferramenta de análise e, desta forma, é imprescindível que se faça presente desde o início de uma investigação científica, auxiliando na operacionalização das hipóteses ou questões de pesquisa, na definição da população e variáveis a serem estudadas, até a coleta e análise dos dados (BAPTISTA, CAMPOS, 2007).

De acordo com Arango (2009), a estatística pode ser dividida em: estatística

exploratória ou descritiva, e estatística analítica ou inferencial. A primeira cuida do

levantamento, organização, classificação e descrição dos dados por meio de tabelas, gráficos, entre outros recursos visuais, além do cálculo de estatísticas representativas desses dados. A segunda, por sua vez, trabalha os dados de forma a estabelecer hipóteses em função desses, para então proceder a sua comprovação, realizando inferências acerca da população de estudo, tomando por base uma amostra, subsidiando assim a tomada de decisão em relação a aspectos específicos dessa população.

Entende-se por população a coleção de todos os elementos (escores, pessoas, medidas e outros) a serem estudados. Já uma amostra é um subconjunto de membros selecionados de uma população. Além desses termos, também se faz necessário compreender os conceitos parâmetro e estatística – não se referindo neste caso à ciência. Um parâmetro é uma medida numérica que descreve alguma característica de uma população e estatística é uma medida numérica que descreve alguma característica de uma amostra (TRIOLA, 2005).

Considerando, então, que o universo ou população de uma pesquisa depende do objeto a ser investigado, a amostra - que realmente será submetida à verificação, deverá ser obtida por uma técnica específica de amostragem. Para isso, há duas grandes divisões no processo de amostragem: a probabilística e a não-probabilística. A amostra não-probabilística deve ser evitada, pois pode conter vícios e até levar a conclusões errôneas (SILVA, 2001).

Uma amostra obtida através da amostragem probabilística pode ser submetida a tratamentos estatísticos. Essa amostragem caracteriza-se por garantir, a priori, que todo elemento que pertença ao universo do estudo tenha probabilidade conhecida, diferente de zero, de pertencer à amostra sorteada (SILVA 2001; MARCONI, LAKATOS, 2008).

A seleção de uma amostra implica o uso de metodologias que garantam que a mesma represente de fato a população de estudo. Entende-se por erro amostral a diferença entre o resultado amostral e o verdadeiro resultado da população; tais erros resultam das flutuações amostrais devidas ao acaso. Ao se definir o valor máximo aceitável para a margem de erro, estará se fixando a precisão do processo de amostragem antes do sorteio da amostra e da obtenção dos resultados (SILVA, 2001; TRIOLA, 2005).

É possível realizar inferências sobre uma população de estudo a partir de uma amostra, através dos testes de hipóteses, procedimento amplamente utilizado na pesquisa científica e que compreende, essencialmente, uma regra de decisão utilizada para rejeitar ou não uma determinada pressuposição acerca de um problema relacionado a uma população específica (PAGANO, GAUVREAU, 2004; ARANGO, 2009).

Considera-se que uma hipótese é uma afirmativa acerca de uma propriedade da população. Para se testar essa afirmativa, de modo a definir sua validade, define-se um valor de referência para o parâmetro populacional de interesse (como proporção, média ou desvio padrão), estabelecendo desse modo uma afirmação, denominada hipótese nula (H0). A

hipótese alternativa (H1), é uma segunda afirmação que contradiz H0. Assim, juntas, as hipóteses nula e alternativa cobrem todos os valores possíveis do parâmetro populacional de interesse e, conseqüentemente, uma das duas afirmações é verdadeira (PAGANO, GAUVREAU, 2004; TRIOLA, 2005).

Vale ressaltar que, ao se formular uma decisão sobre H0 podem ocorrer dois erros distintos. O primeiro, denominado erro tipo I, consiste em rejeitar a hipótese nula quando ela é verdadeira. O segundo, chamado erro tipo II, consiste em aceitar a hipótese nula quando ela é falsa. A estes erros estão associadas as probabilidades: P(rejeitar H0 | H0 verdadeira) = α e P( aceitar H0 | H0 falsa) = β. As regras de decisão são construídas, portanto, seguindo critérios que permitam reduzir os erros a elas associados. O controle desses erros é feito usualmente a partir da seleção do nível de significância (α) e do tamanho da amostra, uma vez que, matematicamente, α, β e o tamanho amostral estão relacionados entre si, de modo que a determinação de dois deles implica na determinação do terceiro (PAGANO, GAUVREAU, 2004; TRIOLA 2005; ARANGO 2009).

Os testes de hipóteses podem ser unilaterais (à direita ou à esquerda) ou bilaterais. No teste bilateral, a região crítica ou região de rejeição de H0 está situada nas regiões extremas da curva. Para o teste unilateral, a região crítica ou região de rejeição está situada na região extrema esquerda da cauda ou na região extrema direita da cauda sob a curva. Além disso, em testes bilaterais, o nível de significância α é dividido igualmente entre as duas caudas que constituem a região crítica. Já em testes unilaterais à esquerda ou à direita, a área da região crítica é α (TRIOLA, 2005).

Assim sendo, se os valores amostrais pertencerem à região crítica, a hipótese nula é rejeitada. Caso contrário, se não houver evidências suficientes para duvidar da validade da hipótese nula, não se poderá rejeitar a afirmação (PAGANO, GAUVREAU, 2004; TRIOLA, 2005).

Quando os métodos de inferência estatística fundamentam-se na amostragem de uma população com parâmetros específicos, a citar, por exemplo, média, proporção, entre outros, e atendem à exigência de que os dados amostrais sejam provenientes de uma população com distribuição de probabilidade conhecida, são denominados métodos paramétricos. Nos casos em que essa exigência não é atendida, temos os chamados métodos não-paramétricos. Já que não precisam atender a essa exigência, os testes não-paramétricos se aplicam a uma grande variedade de situações e, normalmente, envolvem cálculos mais simples, sendo, portanto, mais facilmente compreendidos e aplicados. Entretanto, em função da simplicidade de operacionalização e da redução dos dados numéricos a dados categóricos, tendem a desperdiçar informações importantes, além de exigir vidências mais fortes para a rejeição da hipótese nula, como uma amostra maior, por exemplo (TRIOLA, 2005).

De acordo com Oliveira (2011), quando se pretende realizar inferências acerca de uma característica populacional, no caso do parâmetro de interesse ser uma proporção, é aplicado o

usualmente testadas através do uso da distribuição normal como aproximação para a distribuição binomial. Desse modo, têm-se as seguintes hipóteses:

H0 : p = p0 H0 : p = p0 H0 : p = p0

H1 : p ≠ p0 H1 : p ≥ p0 H1 : p ≤ p0

Uma vez estabelecidas as hipóteses, a estatística do teste é definida por:

em que n = tamanho da amostra ou número de tentativas; pˆ = proporção amostral; p0 = proporção populacional aplicada à hipótese nula.

Com base no resultado obtido, a um nível de significância α, segue-se com a decisão. Tomando-se como exemplo o teste bilateral, temos como possíveis decisões:

se - Zα/2 ≤ Zcal ≤ Zα/2, não se pode rejeitar H0; se Zcal > Zα/2 ou Zcal < - Zα/2 , rejeita-se H0.

Ainda em relação à proporção enquanto parâmetro de interesse, em alguns casos há a necessidade de proceder a comparação entre proporções de dois grupos distintos. Para tanto, utiliza-se o Teste para Diferença entre Proporções.

Quando se pretende realizar inferências sobre duas proporções p1 e p2, os valores de duas amostras independentes são comparados a fim de saber se os grupos diferem ou não em relação à proporção de indivíduos que optaram por uma resposta de interesse.

Assim sendo, tem-se as seguintes hipóteses:

H0 : p1 = p2 H0 : p1 = p2 H0 : p1 = p2 H1 : p1 ≠ p2 H1 : p1 ≥ p2 H1 : p1 ≤ p2

Tomando-se como exemplo o caso do teste bilateral, para a hipótese nula (H0) tem-se a afirmativa de que as proporções populacionais são iguais, enquanto que a hipótese alternativa (H1) afirma que as proporções populacionais são diferentes.

A fim de testar afirmativas sobre duas diferentes populações, a estatística do teste é expressa por:

em que n1= tamanho da amostra 1; n2 = tamanho da amostra 2; pˆ1 = proporção da amostra 1 e

pˆ2 = proporção da amostra 2; pˆ = proporção populacional aplicada à hipótese nula. No que tange à decisão, a um nível de significância α, temos que:

se - Zα/2 ≤ Zcal ≤ Zα/2, não se pode rejeitar H0; se Zcal > Zα/2 ou Zcal < - Zα/2 , rejeita-se H0.

Os testes de hipóteses podem ser aplicados ainda quando são considerados dados categóricos resumidos em contagem de freqüências que correspondem a duas diferentes variáveis, listadas em uma tabela de dupla entrada. Nesses casos, há um tipo de teste que pode ser aplicado e que se baseia em tabelas de contingência: o Teste de Independência.

Esse teste é usado quando se pretende testar se há associação entre as freqüências observadas e as freqüências esperadas de variáveis que expressam características de uma única amostra. Isto é, se as diferenças observadas se apresentam devido ao acaso, ou se são estatisticamente significativas.

Numa tabela de contingência de r linhas e c colunas, a hipótese H1 afirma haver discrepâncias entre as freqüências observadas e esperadas (dependência), enquanto que para H0 essas freqüências não apresentam discrepâncias entre si (independência).

A estatística do teste de independência é definida por:

em que Oj representa a freqüência observada e Ej representa a freqüência esperada.

Nesses casos, os valores críticos são encontrados a partir de uma distribuição Qui- Quadrado usando-se graus de liberdade igual a (r – 1)x(c – 1), onde r é o número de linhas e

c é o número de colunas (TRIOLA, 2005).

Considerando um nível de significância α, se χ2cal < χ2tab, não se pode rejeitar H0, o que implica dizer que as freqüências observadas e esperadas não são discrepantes. Para χ2cal >

χ2

tab, rejeita-se H0, o que permite concluir que há discrepâncias entre as freqüências observadas e esperadas (TRIOLA, 2005).

Através da aplicação dos métodos estatísticos aqui mencionados, é possível transformar conjuntos complexos em representações mais simples a fim de verificar eventuais relações, o que permite a “tradução” de determinados fenômenos em uma linguagem mais acessível e confiável.

Ressalta-se a relevância da aplicação de tais métodos para a compreensão dos fenômenos, observáveis sob diferentes aspectos, pertinentes ao campo da Saúde Coletiva, possibilitando análises bem estruturadas que fornecem o conhecimento necessário à tomada de decisão (LÉO; GONÇALVES, 2010 apud OLIVEIRA, 2011).

In document Sosioøkonomisk bakgrunn og leseferdigheter : En kvantitativ undersøkelse av sammenhengen mellom sosioøkonomisk bakgrunn og leseferdigheter på 3. trinn (sider 61-0)