2 LITERATURE REVIEW
2.5 Variation of Brassica
2.5.1 Cauliflower (Brassica oleracea L.var. botrytis)
As adaptações estatísticas que seguem atendem às investigações do grau de êxito do nosso empreendimento ou processo de ensino-aprendizagem de escala cartográfica linear. Chamamos de êxito a evolução das notas da avaliação final em relação à avaliação inicial que os alunos participantes do processo em foco tenham apresentado. Então, para o nosso parecer, nos subsidiaremos dessa adaptação para orientação de respostas que buscamos. Assim, teremos elementos que nos confirmem tal êxito ou que nos sugira refletir objetivando aperfeiçoamentos ou alternativas. Portanto, estas adaptações fundamentarão os nossos procedimentos estatísticos, portanto.
Então, a nossa ocupação inicial é a escolha de processos técnicos estatísticos apropriados para nossas problemáticas de investigação, ou seja, se obtivemos êxito com o nosso empreendimento pedagógico. Isso nos leva a pré-estabelecer os procedimentais testes de diferença e de medidas de correlação em função dos níveis de mensuração que utilizaremos.
No nível de mensuração ordinal lançaremos mão do teste da mediana e no nível nominal, do teste qui-quadrado. O teste da mediana é um teste não paramétrico para comparar duas amostras e o teste qui-quadrado é um teste não paramétrico para comparar duas ou mais amostras.
Um pesquisador que não possa utilizar um teste paramétrico por não poder admitir a normalidade da distribuição de dados colhidos, não dispor de grandes números de casos ou cujos dados não possam ser medidos em nível intervalar. Então, para ele, as alternativas estatísticas são os testes de significância não paramétricos, porque utilizam níveis de mensuração nominal e ordinal. Essas alternativas fazem exigências menos severas, consequentemente sendo testes de significância menos poderosos do que seus correspondentes paramétricos. Afinal, nem sempre é possível sequer se chegar perto da satisfação das exigências dos testes paramétricos (LEVIN; FOX, 2004, p. 294).
1.5.2.1 Teste de significância qui-quadrado
O teste qui-quadrado (χ2) de Pearson indica a significância da diferença entre um conjunto de frequências observadas (fo) e um conjunto de frequências esperadas (fe). Quanto maiores as diferenças entre essas frequências, maior é a chance de uma diferença significativa, o que sugere que a hipótese nula não é plausível. A fórmula da estatística qui- quadrado é:
χ2 = ∑ 0 − 𝑒 ² 𝑒 onde,
fo = frequência observada em qualquer categoria
fe = frequência esperada em qualquer categoria (LEVIN; FOX, 2004, p. 296)
Em teste de significância qui-quadrado com duas variáveis, os cálculos das frequências são organizados por meio de tabela. E nesta, as tabulações cruzadas comparam a distribuição de uma variável, frequentemente chamada variável dependente, por meio de categorias de alguma outra variável, a variável independente (LEVIN; FOX, 2004, p. 299- 300).
Pode-se aplicar um qui-quadrado de duas variáveis para testar uma tabulação cruzada, comparando-se também frequências observadas com frequências esperadas sob a hipótese nula. Emprega-se o χ2 para fazer comparação entre frequências, em vez de comparações entre escores médios. Como resultado, a hipótese nula H0 para o teste χ2 afirma que as populações não diferem quanto à frequência de ocorrência de determinada característica, ao passo que a hipótese de pesquisa H1 afirma que as diferenças amostrais refletem diferenças populacionais efetivas, concernentes à frequência relativa de determinada característica (LEVIN; FOX, 2004, p. 300).
As frequências esperadas para cada cela devem refletir a atuação de chance sob as condições da hipótese nula. Se as frequências esperadas devem indicar igualdade por meio de todas as amostras, elas devem ser proporcionais a seus totais marginais, tanto para linhas como para colunas (LEVIN; FOX, 2004, p. 304).
fe = 𝑎 𝑎 𝑖 𝑎 𝑖 ℎ𝑎 𝑁 𝑎 𝑎 𝑖 𝑎 𝑎
As condições ou exigências para o uso do qui-quadrado com duas variáveis são: comparação entre duas ou mais amostras independentes, dados nominais, amostragem aleatória e frequências esperadas nas celas não muito pequenas.
Em relação à primeira condição, a suposição de independência indica que o χ2 não pode ser aplicado a uma amostra única que tenha sido estudada em um planejamento do tipo painel antes-depois. Devemos obter, ao menos, duas amostras de participantes da pesquisa (LEVIN; FOX, 2004, p. 315). Em relação à quarta condição, sendo inferior a 10, as pequenas frequências esperadas devem ser corrigidas.
Conforme Levin; Fox (2004, p. 313-314), em tabelas 2 × 2, a exigência é que todas as frequências esperadas sejam, no mínimo, iguais a 5. Além disso, podem ocorrer distorções se as frequências esperadas forem inferiores a 10. Mas, há uma solução: correção de Yates. Daí, a fórmula corrigida do qui-quadrado para pequenas frequências esperadas é:
𝜒𝑌𝑎 = ∑ | 0 − 𝑒𝑒|− ,5 ²
Essa correção é recomendada nos testes χ2 somente quando gl14 = 1 (CALLEGARI- JACQUES, 2003, p. 140). E além da frequência esperada não poder ser menor que 5, também não deve ser aplicada para diferenças entre fo e fe menores que 0,5 (MOTTA, 2006, p. 162).
Este teste se realiza por meio de passos (LEVIN; FOX, 2004, pág. 319-320) (APÊNDICE B, subtítulo 3.1), cujos resultados são comparados com valores tabelados (ANEXO A).
O procedimento para comparar vários grupos ou categorias é essencialmente o mesmo que seu correspondente (LEVIN; FOX, 2004, p. 308), ou seja, o testes qui-quadrado com duas variáveis.
Para a situação em que se comparam vários grupos, não há regra fixa para as frequências mínimas das celas, embora deva haver cuidado para que apenas poucas celas contenham menos de 5 casos (LEVIN; FOX, 2004, p. 315-316). Levin; Fox (2004, p. 312) expõem também que alguns pesquisadores relaxam a restrição em relação ao valor mínimo das frequências esperadas, insistindo apenas em que a maioria dessas seja no mínimo 5.
14 Graus de liberdade, em comparações de pequenas amostras, são uma compensação estatística pelo fato de não se poder assumir que a distribuição amostral de diferenças toma a forma da curva normal (LEVIN; FOX, 2004, p. 482).
Com efeito, estudos recentes sugerem que as exigências quanto às frequências esperadas são rigorosas demais, sendo que muitos valores de fe podem ser iguais a 1 sem comprometer o teste. Assim, dentre as outras condições, uma abordagem mais moderna considera que em tabela de contingência (dupla entrada) com duas linhas e mais de duas colunas, o χ2 pode ser calculado se todos as f
e forem ≥ 1 (CALLEGARI-JACQUES, 2003, p. 140-141).
Para que se possa estabelecer se a diferença amostral obtida é estatisticamente significante, resultado de uma diferença populacional real e não apenas do erro amostral, estabelece-se um nível de significância α (alfa). Convencionalmente, usa-se α = 0,05 (LEVIN; FOX, 2004, p. 230-231). O seu valor é dado por “α = 1 – nível de confiança”. Por exemplo, para um nível de 95% de confiança, α = 0,05; para um nível de 99% de confiança, α = 0,01, etc. (LEVIN; FOX, 2004, p. 202).
Os níveis de significância não constituem uma afirmação absoluta em relação às hipóteses. A decisão em se rejeitar uma hipótese em um determinado nível de significância leva à exposição ao risco da tomada de decisão errada. Um erro tipo I só pode surgir quando se rejeita a hipótese nula, e sua probabilidade varia de acordo com o nível de significância escolhido. E quanto mais rigoroso for o nível de significância, menos chance se tem de cometer um erro tipo I, porém, maior será o risco de se cometer o erro tipo II. Uma maneira de reduzir o risco de cometer um erro desses consiste em aumentar o tamanho das amostras, de modo que uma verdadeira diferença populacional tenha maior chance de ser representada (LEVIN; FOX, 2004, p. 232).
O nível de significância para um teste de hipótese é predeterminado com base em qual tipo de erro é mais custoso ou danoso e, por conseguinte, mais arriscado. Portanto, em razão da natureza inócua de muita pesquisa, tornou-se habitual o uso de um nível modesto de significação, em geral o convencional α = 0,05 (LEVIN; FOX, 2004, p. 233-234).
E encerramos aqui um bloco relacionado a um teste de significância não paramétrico, passando, a seguir, para outro teste.
1.5.2.2 Teste da mediana
A mediana (Mdn) é o escore mais central na lista ordenada de escores. Em um número ímpar de escores, a mediana é o valor que está no meio da lista; em um número par de
escores, a mediana é o valor a meio caminho entre os dois escores mais centrais (LEVIN; FOX, 2004, p. 98).
A mediana se situa entre as outras medidas de tendência central (moda e média), proporcionando uma representação equilibrada dos escores extremos. Eventualmente, pode ser usada para operações estatísticas mais avançadas ou para separar distribuições em duas categorias. E ela é mais apropriada para assimetria acentuada da distribuição dos dados (LEVIN; FOX, 2004, p. 88, 91 e 97).
Para dados ordinais, o teste da mediana é um processo não paramétrico simples para determinar a possibilidade de duas ou mais amostras aleatórias terem sido extraídas de populações com a mesma mediana. Essencialmente, esse teste envolve um teste de significância qui-quadrado em uma tabulação cruzada, em que uma das dimensões é se os escores situam-se acima ou abaixo da mediana dos dois grupos combinados. [Como no testes qui-quadrado com dois critérios], usa-se a correção de Yates para um problema 2 x 2 (comparação de duas amostras) com pequenas frequências esperadas (LEVIN; FOX, 2004, p. 316).
As condições para o uso da medida pelo teste da mediana são: comparação entre duas ou mais medianas provenientes de amostras independentes, dados ordinais ou dados intervalares e amostragem aleatória de uma determinada população (LEVIN; FOX, 2004, p. 318).
E os testes de diferenças entre grupos para dados em nível ordinal utilizando o teste da mediana se dão por meio de passos (LEVIN; FOX, 2004, p. 317, 318 e 320) (APÊNDICE B, subtítulo 3.2), cujos resultados devem ser confrontados com a tabela (ANEXO A).
2 ENSINO-APRENDIZAGEM DE ESCALA CARTOGRÁFICA LINEAR POR