• No results found

A avaliação educacional foi fortemente influenciada pela evolução dos sistemas de mensuração, chegando à era contemporânea da epistemologia como atividade científica

especificamente em 1934, com os trabalhos de Ralph Winfred Tyler (1902-1994), teórico que instituiu o termo avaliação educacional e criou um modelo sistemático para controlar as atividades mais diretamente ligadas à educação.

No período que antecedeu à Segunda Guerra Mundial (1939-1945), Tyler idealizou, planejou e desenvolveu um estudo experimental, de caráter longitudinal, em trinta escolas, que ficou conhecido como The Eight-Year-Study, a fim de analisar os resultados dos programas educacionais nos Estados Unidos e esclarecer dúvidas sobre a eficiência de vários tipos de escolas (VIANNA, 2000).

Partindo do princípio de que educar consiste em gerar e/ou mudar padrões de comportamento, Tyler propôs que o currículo deveria ser construído com base na especificidade de habilidades desejáveis expressas em objetivos delineados. Suas pesquisas trazem a concepção de Avaliação educacional por objetivos, uma nova visão de avaliação que tem por base comparar os objetivos estabelecidos com os que foram realmente atingidos. Tal proposta partiu da medida dos objetivos comportamentais, mas preocupando-se também com:

[...] os resultados da educação, que deveriam provocar mudanças comportamentais nos padrões preestabelecidos pela sociedade. Ou seja, os objetivos propostos precisariam estar em estreita relação com os resultados esperados, pois só assim se concretizaria a mudança de novos valores sociais e culturais. (MACEDO; LIMA, 2013, p. 159).

As bases teóricas de Tyler foram construídas a partir dos estudos sobre testes de inteligência de Alfred Binet, em que:

Os resultados dos chamados testes de inteligência eram utilizados na interpretação do desempenho dos estudantes nos testes de escolaridade, sobretudo quando se tratava de um baixo desempenho. A idéia de que qualquer pessoa poderia aprender começou a ser posta à prova e, em conseqüência, houve mudanças nos testes de rendimento, que eram referenciados a critério e o desempenho do aluno era acompanhado a um valor absoluto, passando a testes do tipo referenciados a normas, em que o desempenho do estudante é relacionado ao comportamento do seu grupo. (VIANNA, 2000, p. 48).

Entretanto, diz Depresbiteris (1989), a geração descritiva ou período tyleriano trouxe rupturas epistemológicas ao libertar a avaliação do domínio único da medida, com uma primeira diferenciação efetiva entre avaliação e medida, sendo que a avaliação, embora também utilizasse medidas educacionais, passou a ser considerada como uma verificação do alcance dos objetivos educacionais e curriculares. Vianna (2000, p. 50) reforça que, desse modo, “[...] a avaliação proporcionaria subsídios para uma análise crítica da instituição, possibilitando a reformulação de sua programação curricular.”.

Essa nova lógica possibilitaria verificar a congruência entre objetivos e resultados a fim de convalidar os pressupostos em que se baseiam os programas curriculares, eliminando os aspectos inoperantes e aprimorando a reestruturação de novos currículos, demonstrando, assim, a ideia de que avaliar “[...] não é só para medir mudanças comportamentais, mas também a aprendizagem, portanto, para quantificar resultados, encontra-se apoiada na racionalidade instrumental preconizada pelo Positivismo.” (CHUERI, 2008, p. 56).

O modelo de Tyler, em 1942, era consignado ao paradigma da racionalização científica, até então utilizado nos processos industriais, correlacionado diretamente com a preocupação com os resultados (produto) referentes ao cumprimento eficiente dos objetivos previamente planejados para o programa. Sendo assim, a avaliação se desenvolve de acordo com “[...] o paradigma de racionalização científica que caracteriza a pedagogia por objetivos, compromissada com a ideologia utilitarista tão peculiar à indústria e que tem suas raízes mais fortes no começo do século XX nos Estados Unidos.” (DIAS SOBRINHO, 2003, p. 19-20).

Nesse espectro, a avaliação, para Tyler, está identificada como um processo de investigação de valores, devendo verificar, periodicamente, a eficiência e/ou ineficiência das escolas e sistemas de ensino. Para tanto, a eficiência estaria associada às coincidências e discrepâncias entre o prometido (objetivo) e o cumprido (resultado), levando em consideração o maior grau de custo-benefício. Segundo Vianna (2000), a avaliação educacional teria como finalidade promover a eficácia escolar e de seus métodos educativos; a óptica da escola passa a ser rentável, produtiva, eficiente e útil ao desenvolvimento econômico, configurando-se como um modelo avaliativo cuja

Característica marcante da avaliação científica educacional contemporânea passa de um ambiente microavaliativo para um espaço macroavaliativo, visando ao programa e à estrutura educacional como um todo, expandindo-se aos propósitos educacionais, aos currículos e suas relações com os sistemas sociais, econômicos e políticos. (DEPRESBITERIS, 1989, p. 5).

Começa a ocorrer uma preocupação com a accountability, com a prestação de contas, metodologia utilizada pelo poder público na rendição de contas à população dos serviços que oferece, assim como por agências financiadoras. As reformas na administração pública mobilizadas desde a metade do século XX focalizaram a eficiência e a eficácia em favor das quais foi introduzida a descentralização dos serviços (ABRUCIO, 1997). Essas reformas pautaram-se, inicialmente, no modelo administrativo puramente gerencial, com a lógica de mercado sendo transposta à gestão pública. A atenção concentra-se na accountability, na eficiência e no controle da qualidade.

Tendo em vista que os objetivos são expressos em termos de desempenhos específicos do estudante e são medidos por testes referenciados a normas ou a critérios, “A abordagem proposta por Tyler é a produtividade, accountability.” (VIANNA, 2000, p. 65). As inovações de Tyler passaram a ser disseminadas e experienciadas, gerando refutações e contestações, às vezes, bastante acaloradas.

Cronbach (1963), epistemólogo da segunda geração, apresentou crítica ao modelo de Tyler quanto à ideia de restringir a avaliação aos aspectos rotineiros e ritualísticos da mensuração. Sua concepção de avaliação vai além de limitá-la aos resultados finalísticos dos objetivos. Compreendia o caráter multidimensional dos resultados da aprendizagem e considerava que ela não poderia ficar refém de um único escore. Para Cronbach (1963), a avaliação exige uma coleta de dados diversificada a fim de viabilizar uma melhor descrição dos currículos e programas educacionais e possibilitar intervenções dos especialistas no processo de aprimoramento das atividades educacionais.

As posições de Scriven (1967) e Stake (1967), clássicos da terceira geração da avaliação, introduziram novas refutações em face do modelo objetivo de Tyler, ampliando os pontos levantados por Cronbach. Scriven (1967) defendeu a obrigatoriedade do avaliador de determinar o valor e o mérito do que está sendo objeto da avaliação e se contrapôs à avaliação exclusiva em goals (objetivos), devido à impossibilidade para o julgamento do valor ou mérito dos objetivos.

Scriven (1976) define avaliação como a determinação sistêmica e objetiva do valor e do mérito de um objeto. Nessa linha, um objeto só possui qualidade se apresentar valor, atender às necessidades previstas pelas partes interessadas, apresentar mérito e promover resultado eficaz e eficiente. Um objeto pode exibir apenas mérito, mas jamais terá valor sem a presença de mérito. Entende-se, assim, que um objeto sem mérito, ou seja, que não faz bem o que se propôs a fazer, não atende às necessidades de seus stakeholders, logo não tem valor.

Trazendo a concepção de Scriven para o contexto educacional, a eficiência e a eficácia da escola e/ou do professor podem ser medidas a partir de critérios (taxas de evasão, de aprovação, de reprovação, etc.) e de testes padronizados de desempenho escolar, atribuindo, assim, o mérito institucional e/ou profissional. Porém, o julgamento de valor da escola e/ou do professor vai além do reconhecimento do mérito, precisa atender às necessidades das partes interessadas do sistema educacional. Portanto, ações de determinada organização escolar ou de implementação de políticas, programas e projetos educacionais

podem ser avaliadas quanto ao julgamento de mérito, isto é, do reconhecimento do grau de eficiência e de eficácia, como também quanto ao seu valor, relevância e impacto social. Para Scriven (1976), os especialistas em avaliação deveriam avaliar os resultados, julgar os objetivos e tirar conclusões sobre o valor global dos programas. Ou seja, o avaliador intencionalmente ignora os objetivos enunciados de um programa e busca todos os seus efeitos, independentemente de qualquer retórica relativa ao que o programa pretendia produzir. Conforme Scriven, a vantagem é que o avaliador que não se refere aos objetivos pode descobrir efeitos importantes não previstos que o avaliador que se reporta aos objetivos não percebe devido à sua preocupação com os objetivos estabelecidos. Assim, os avaliadores devem julgar tanto os objetivos quanto os resultados (VIANNA, 2000).

Stake (1967) criticou o modelo tyleriano ao afirmar que a avaliação não deveria ter um caráter meramente episódico, mas permitir uma compreensão de todo o processo, através de um levantamento amplo de informações para a tomada de decisões em bases realistas.

Stufflebeam, expoente da quarta geração, apesar de considerar importante esboçar os objetivos a serem alcançados na avaliação, empregou novos elementos ao ato de avaliar. O ponto central de seu modelo não é o objetivo, mas a tomada de decisões. Stufflebeam (1971) ampliou a concepção de avaliação ao considerá-la uma atividade contínua e processual que envolve quatro tipos de avaliação (contexto, insumo, processo e produto – CIPP). Distinto da concepção tyleriana, o modelo CIPP tem orientação formativa para a tomada de decisão e orientação somativa com viés de prestação de contas (accountability).

As críticas feitas a Tyler, geralmente, relacionam-se ao seu individualismo metodológico para a validação dos currículos, por meio de contrastes entre a predição dos objetivos pretendidos e os resultados coletados, e à limitação do modelo para a reformulação das experiências curriculares, visto que a avaliação educacional exige coleta de informações diversificadas, descrição dos currículos ou programas educacionais que identifiquem os elementos que merecem sofrer interações e tomadas de decisão no processo para o aprimoramento das atividades educacionais.

Depresbiteris (1989, p. 7-9) também faz crítica às posições de Tyler, considerando que ele “[...] pecava por considerar a avaliação como atividade final de alcance dos objetivos, sem vinculá-la a um processo contínuo e sistemático, para o qual concorre julgamento de valor.”.

Segundo Vianna (2000), a reação mais exacerbada contra a avaliação por objetivos partiu de Parlett e Hamilton (1972). Eles a rejeitavam por muitos aspectos: pela

influência da tradição psicológica, pela ausência de uma abordagem sociológica que considerasse os valores humanos e pelo quantitativo do modelo por objetivos.

Apesar das críticas, Escudero (2003, p. 6-7) comenta que:

Tyler lançou os fundamentos de um modelo de avaliação que vai sendo desenvolvido com o passar do tempo. As premissas teóricas de Tyler influenciaram outros estudos, dentre eles, a teoria da taxonomia dos objetivos, de Benjamin Bloom, na década de 1950, que prevê uma estrutura de organização hierárquica para os objetivos educacionais e que também classifica os tipos de aprendizagem em cognitivo, afetivo e psicomotor, criando subdomínios para estes campos.

A tendência norte-americana, baseada no positivismo, foi absorvida pelos autores brasileiros, que, ao longo da década de 1970, dedicaram-se a fornecer informações e orientações para o desenvolvimento de testes e medidas educacionais ancoradas nos princípios de Tyler. Tal influência também esteve presente na elaboração de leis e decretos federais e estaduais sobre avaliação escolar de educação básica (CALDERÓN; POLTRONIERI, 2013).

Com a racionalização científica, a avaliação educacional avançou muito, ocorreu uma evolução epistemológica que foi incorporando, paulatinamente, novos conceitos, finalidades, métodos e também redimensionando aspectos relacionados à dimensão política e à prática da avaliação. Nas últimas décadas do século XX e no início do século XXI, a literatura, nesse campo, proliferou-se: “[...] Se na fase pré-tyleriana a avaliação foi confundida com medida, na era tyleriana predominou, em sua essência, a valorização tecnicista dos objetivos educacionais que, inclusive, mantêm-se na avaliação de programas até os dias atuais [...].” (DEPRESBITERIS, 1989, p. 5).

Contudo, as ideias de Tyler têm dominado a teoria e o desenvolvimento da

avaliação em larga escala. Os testes padronizados de validação dos objetivos educacionais e curriculares, apesar de terem sofrido atualizações com as novas técnicas de elaboração e correção dos itens, ainda assim, comumente, são empregados para verificar a eficiência e a eficácia das escolas.

No próximo capítulo, ver-se-á que os testes padronizados para aferir o mérito (eficácia e eficiência) das instituições escolares, as inovações técnicas de elaboração e a correção dos itens estão presentes nos sistemas de avaliação no Brasil, os quais vêm se aperfeiçoando lentamente, mas ainda apresentam problemas e carecem de mais estudos e discussões.

3 TRAJETÓRIA HISTÓRICA E PERSPECTIVAS DA POLÍTICA DE AVALIAÇÃO