Studier av sammenhengen mellom utdanning og holdninger til innvandring, relativ

2.2 Sammenhengen mellom utdanning og holdninger til innvandrere

2.2.4 Studier av sammenhengen mellom utdanning og holdninger til innvandring, relativ

O desenvolvimento de qualquer programa de mensuração depende da qualidade dos seus instrumentos de medida (qualidades psicométricas). Assim, vale ressaltar os critérios que devem ser considerados no processo de seleção destes instrumentos, tais como validade, fidedignidade, objetividade, tendenciosidade e confiabilidade. Segundo Tritschler (2003), um instrumento de medida e avaliação necessita de um grau significativo e igualmente relevante dessas qualidades psicométricas.

Neste ambiente, a validade é considerada o requisito básico, já que se refere à veracidade e acurácia de um instrumento de medida. Ou seja, quão verdadeiramente um instrumento mede o atributo para o qual ele foi proposto, permitindo assim, que inferências sejam feitas a partir dos resultados da medida. A validade é específica, de uso particular e refere-se à natureza intrínseca do instrumento de medida. Portanto, um instrumento é válido quando mede aquilo que realmente pretende medir (VERDUCCI, 1980; TRITSCHLER, 2003). A validação requer diversas evidências para suportar as inferências feitas a partir de resultados de uma avaliação. Neste sentido, existem diferentes tipos de validade, onde, geralmente, distinguem-se quatro fundamentais: relacionadas por critério (preditiva e concorrente), de conteúdo e de constructo (TRITSCHLER, 2003; BAUMGARTNER; JACKSON, 1991; SAFRIT, 1981; VERDUCCI, 1980).

A validade relacionada por critério é definida acerca de três fatores:

resultados do instrumento de medida, critério de referência e grau de relação entre os resultados do instrumento de medida e o critério de referência. O critério de referência é qualquer atributo ou propriedade que se precise determinar, destaca-se por ser a forma de medida mais direta e, utiliza o melhor equipamento de medida (VERDUCCI, 1980).

A validade por critério é dividida em preditiva e concorrente. A validade

preditiva se refere até que ponto uma medida calculará um comportamento futuro;

enquanto que a validade concorrente se refere até que ponto uma medida

calculará um desempenho atual (VERDUCCI, 1980). Onde, as evidências da validade concorrente demonstram o grau que os resultados da avaliação estão relacionados a outros critérios válidos (TRITSCHLER, 2003).

A validade de conteúdo consta de quão bem um instrumento de medida

prova os objetivos de um curso ou conteúdo de classe (VERDUCCI, 1980).

A validade de constructo consiste do julgamento de até que ponto dados

lógicos e estatísticos apóiam um constructo. O constructo é uma idéia teórica que explica e organiza algum aspecto do conhecimento existente, o qual evidencia sua validade num acúmulo de estudos e pesquisas em lugar de um único estudo de referência (VERDUCCI, 1980). Esta validade pode ser acessada quando o pesquisador acredita que o seu instrumento reflete um constructo particular que está atrelado a certos significados. A interpretação proposta gera hipóteses significativas que, quando testadas, fornecem ou não, um significado de confiança referente ao que foi alegado (PERROCA, 2004).

Como critérios para testar a validade em medidas repetidas, são utilizadas diversas ferramentas estatísticas, tais como: testes de hipótese nula, análises de correlação e regressão linear, diferenças inter-sujeitos, alterações nas médias, intervalo de confiança, erros típico, sistemático e randomizado (residual), além dos escores residuais. Cada ferramenta possui sua capacidade (força) de testagem do fenômeno em modelos experimentais diferentes (ATKINSON et al., 2005).

A fidedignidade se refere à consistência das medidas em testagens

repetidas. Um instrumento fidedigno deve medir consistentemente um atributo, de forma que os resultados reflitam as diferenças entre os examinados. Uma alta fidedignidade pode ser obtida apenas se as fontes de erro de medida forem reduzidas ou eliminadas. Alguns fatores podem afetar a fidedignidade, tais como: variação sistemática (variação de resposta do indivíduo) e flutuações do acaso (distração temporária, variação de comportamento). Portanto, todo instrumento válido é também fidedigno, mas nem todo instrumento fidedigno é, necessariamente, válido (TRITSCHLER, 2003; BAUMGARTNER; JACKSON, 1991; SAFRIT, 1981; VERDUCCI, 1980).

A objetividade também é uma medida de consistência, mas na obtenção do

resultado do instrumento de medida, e não no desempenho do examinado. A objetividade se refere à exatidão do sistema de obtenção de resultados de um instrumento de medida. Um instrumento de medida objetivo pode ser usado consistentemente por diferentes examinadores para obter resultados semelhantes (TRITSCHLER, 2003).

A tendenciosidade de medida está relacionada à validade, referindo-se à

imparcialidade do instrumento de medida. Um instrumento que é livre de tendências em medida é apropriado para examinar todos os grupos para os quais o instrumento foi planejado. Significa que o instrumento é livre de discriminações de resultados injustos ou artificiais contra membros de determinado sexo, descendência étnica ou com outro traço distinto em particular (TRITSCHLER, 2003).

Para ser considerado um bom instrumento de medida, ele deve ser válido, fidedigno, objetivo e livre de tendências na medida.

Neste estudo a validade requerida foi a concorrente. No caso, foi investigado o grau de concordância entre a Monark® e a BECI, sob o aspecto da imposição de carga aos ciclistas. Dessa forma, para testar a validade da BECI, foi necessário submetê-la a um experimento que permitisse concluir se ela sobrecarrega metabolicamente os ciclistas da mesma forma que o cicloergômetro Monark® o faz.

Num programa de mensurações, além das qualidades psicométricas dos instrumentos, há que se determinar a magnitude dos erros de medida. Esta necessidade se relaciona com a condição em que valor observado de uma medida difere do verdadeiro valor. São diversos tipos de erros, tais como: típico, aleatório, sistemático, diversos tipos de erro padrão, dentre outros.

Para análise do erro de medida dois aspectos devem ser considerados, no caso, a validade simultânea e a confiabilidade no reteste. A validade simultânea serve para analisar o valor observado com o real ou com um valor critério de referência. Já a confiabilidade no reteste, relaciona-se com a fidedignidade das medidas em diferentes momentos (HOPKINS, 2000), ou seja, com o montante de erro aceito para uma ferramenta/instrumento de medida na condição de teste e reteste (ATKINSON et al., 2005). Nesta direção, a análise de validade é um procedimento complexo, sobretudo, devido à presença inevitável de erro no próprio critério de referência (HOPKINS, 2000). No presente estudo, foi realizado apenas um teste em cada cicloergômetro o que não permitiu testar a objetividade da BECI.

Em estudos de validade e confiança, podem-se destacar os erros: típico-

derivado das diferenças entre os desvios padrões de cada sujeito, ou, da diferença média entre os escores; sistemático- derivado do resultado de um infinito número de medições do mesmo fenômeno menos o valor critério referência, efetuadas sob condições de repetitividade; e, randomizado (aleatório)- derivado do efeito

menos a média que resultaria de um infinito número de medições do critério referência, efetuadas sob condições de repetitividade (HOPKINS, 2000; ATKINSON et al., 2005). Neste estudo, o erro randomizado foi quantificado através da média das diferenças entre os cicloergômetros.

Um aumento no erro randomizado acompanhado de aumentos nos valores medidos, é característico e comum para dados pertinentes ao esporte e às ciências de exercício. Nesta área, o erro randomizado é proporcional aos valores absolutos medidos (ATKINSON et al., 2005).

Os pesquisadores devem delimitar com antecedência à realização dos estudos a magnitude para aceitação ou rejeição do erro, e isto se fundamenta nas delimitações do campo prático (ATKINSON et al., 2005). Segundo Hodges et al. (2005), apesar dos valores de erro aceitos pela literatura em estudos de validação, os cientistas é que devem decidir sobre o nível de acurácia pretendido para seus propósitos.

Atkinson et al. (2005) afirmam que os erros sistemáticos entre métodos são desprezíveis, mas que deve ser considerado o erro randomizado para medidas individuais entre dois métodos. Os intervalos (limites) de confiança de 95% representam à diferença máxima possível que um sujeito teria sua equivalência entre dois métodos e, a gama provável de valores de uma variável dentro do erro da população. Entretanto, o intervalo de confiança de 95% é muito amplo para um limite de decisão, quando os participantes são atletas e o ambiente de análise é o desempenho atlético.

Em estudos de validação de cicloergômetros por meio da calibração dinâmica indireta, é necessário medir as trocas respiratórias através de sistemas de análise de gases. Portanto há que se delimitar o erro aceitável para as variáveis oriundas dessa instrumentação.

Tem sido descrito na literatura uma variação aceitável para o máximo consumo de oxigênio de ± 2,0 ml/kg/min-1, assim, se o intervalo de confiança de 95%

estiver na região de equivalência de ± 2,0 ml/kg/min-1 então, as diferenças nos valores

brutos não representam qualquer tipo de impacto prático ou clínico (ATKINSON et al., 2005). Segundo Hodges et al. (2005) inúmeros estudos têm testado a validade e reprodutibilidade de sistemas de análise de gases com objetivos variados. Dentre os vários parâmetros analisados encontram-se a variabilidade da medida dia-a-dia e o erros inter e intra-laboratórios. Skinner et al. (1999) sugerem que os maiores níveis

de reprodutibilidade do VO2MAX estão em 4,1% na condição de teste e reteste inter-

laboratório.

In document Kan kontakt endre holdninger? En undersøkelse av Gordon Allports kontakthypotese, komplisert operasjonalisering og alternative teorier. (sider 35-39)