Forventninger og erfaringer i det politiske arbeidet

Kapittel 3 – Empiri og tidligere forskning

3.2 Forventninger og erfaringer i det politiske arbeidet

Quando temos a tarefa de classificar um dado grupo de atributos tendo como base um conjunto de valores previamente identificados e classificados, pode-se dizer que temos uma tarefa de classificação ou de estimação. A diferença entre as duas reside no formato dos dados obtidos como resultado da tarefa. Se a tarefa de classificação trouxer como resultado um grupo único e discreto de valores estamos na presença de uma classificação. Por outro lado, se recebermos como output dados contínuos de informação provenientes de uma classificação de dados numéricos, assistimos a uma estimação.

O propósito da utilização de métodos que permitem a classificação, ou estimação de conteúdos, tem frequentemente a si adjacente o objetivo que prima pela previsão de valores. De facto, neste contexto podem-se utilizar os métodos anunciados com vista a se se conseguir prever qual o valor classificativo que determinado conjunto de valores terá a si associado desde que, para tal, exista um conhecimento prévio de associações classificativas já existentes. É desta forma que se podem utilizar regras classificativas devidamente extraídas dos dados de teste para que, assim, se possa prever a classificação provável que os novos registos terão.

Posta a apresentação dos objetivos que poderão estar intrínsecos à utilização de métodos classificativos, torna-se agora relevante perceber o método geral de funcionamento dos mesmos, bem como descobrir qual o conjunto de algoritmos que poderão auxiliar no desempenho desta função. O processo de classificação assenta em dois grandes passos: descoberta de regras de classificação e classificação de novos dados através das regras obtidas. Neste contexto, e antes ainda de ser feita uma abordagem explicativa dos passos apresentados, deverá clarificar-se que o processo que permite a classificação de registos debruçar-se-á sobre três conjuntos de valores referentes a:

1. dados de treino, que constituirão um conjunto de registos representativo dos valores sobre os quais se pretende proceder à obtenção de regras classificação;

2. dados de teste, que servirão como base para que se possa verificar a qualidade dos resultados obtidos pelo algoritmos;

3. novos dados, que representarão os dados sobre os quais se deverá proceder à classificação.

Como exposto, será durante a procura por regras de classificação que serão utilizados dados que representem conjuntos de valores de teste. Como tal, é imprescindível que os dados de teste tenham a si associados as classes classificativas dos mesmos para que, desta forma, se possam utilizar algoritmos de classificação que permitam atingir o objetivo assente na extração de informação auxiliadora do processo de previsão classificativa. Este procedimento de procura de regras classificativas pode ser sumariamente descrito como “aprendizagem” e constituiu, tal como já referido, o primeiro passo do método que objetiva pela previsão de classificações. Feita a descoberta destas regras existe a necessidade em se perceber se as mesmas representam o modelo de forma verosímil e que, portanto, não falhará com dados desconhecidos ou até quando

forem aplicados dados futuros ao mesmo. Como resposta a este requisito, indispensável a um bom modelo classificativo, deverão ser utilizados estes dados de teste que, desta forma, procurarão estimar a precisão das regras encontradas. Feito o reconhecimento de qualidade do modelo resultante poder-se-á, finalmente, proceder à tentativa de previsão dos valores respetivos às classes caracterizadoras dos registos. Os dois últimos procedimentos apresentados (obtenção de qualidade do modelo e previsão classificativa) constituem no seu conjunto o segundo passo respetivo à classificação ou estimação de dados. Tais passos encontram-se sumariamente descritos na figura 2.7, na qual é apresentado um exemplo prático representativo do processo acima explicado.

A seguir serão apresentadas, de forma resumida, algumas metodologias que permitem classificar informação a partir de dados previamente agrupados e classificados.

As árvores de decisão constituem uma das ferramentas mais poderosas no processo de busca de conhecimento assente em padrões de informação. Esta simples representação, usada de forma comparativa às árvores que estamos acostumados a visualizar diariamente, propõe um algoritmo que, para cada conjunto de resultados possíveis provenientes de um dado teste efetuado a um nodo, cria ramos que procuram representar as várias soluções disponíveis. Este processo vai-se repetindo desde a raiz até as folhas onde, aí, se encontra representada a classe final a que o conjunto de elementos raiz pertence. A principal abordagem deste método assenta, portanto, na definição inerente à expressão “divide-and-conquer”. Uma definição mais formal é feita em (Berson & Smith, 1997) onde uma árvore de decisão é descrita como um modelo preditivo que, como o próprio nome refere, pode ser vista como uma árvore. Especificamente, cada ramo da árvore é uma questão classificativa e as folhas da árvore são partições de conjuntos de dados respetivos à sua classificação inerente. Algumas características vantajosas que podem ser encontradas no uso das árvores de decisão são:

 nunca há perda de informação, apesar da divisão feita em cada ramo;

 o modelo é de muito fácil compreensão;

 podem ser adicionados mais cenários;

 suporta tanto dados numéricos como dados não numéricos;

 a sua performance é boa mesmo com o uso de grandes conjuntos de dados.

Além do apresentado, existe um algoritmo baseado no teorema de Bayes que procura obter um modelo classificativo assente na probabilidade de ocorrência de determinados eventos (Zhang, 2004). Este método, que parte do princípio que não existem relações de dependência entre os atributos, procura prever e calcular qual é a probabilidade de um dado acontecimento ocorrer caso já se tenha verificado a ocorrência de um outro. É com base neste conceito probabilístico que o algoritmo procura classificar os dados em grupos distintos sendo que, para tal, associa cada atributo ao conjunto que se proporciona como classe mais provável para este. Este tipo de predição constituiu uma classificação estática, isto é, uma classificação simples e não dinâmica que se baseia apenas no cálculo das probabilidades. Por fim convém ainda referir que, embora este

método Bayesiano funcione para diferentes tipos de dados, este obtém resultados com maior sucesso caso as varáveis de entrada sejam discretas ao invés de contínuas.

Em contraposição aos já apresentados, existe uma técnica cujo nível de complexidade é bem superior aos descritos. Este método denominado de Redes Neuronais deriva o seu nome dos sistemas biológicos que, também eles, têm a função de detetar padrões, fazer predições e obter conhecimento. Neste sentido é feito um paralelo comparativo entre estes dois sistemas tanto ao nível do seu objetivo, como ao nível do seu funcionamento. Uma definição descritiva de uma rede neuronal pode ser apresentada como (Cortez & Neves, 2000): um processador eminentemente paralelo, composto por simples unidades de processamento, que possui uma propensão natural para armazenar conhecimento empírico e tornar-lo acessível ao utilizador. Assemelha-se ao comportamento do cérebro em dois aspetos:

 o conhecimento é adquirido a partir de um ambiente, através de um processo de aprendizagem;

 o conhecimento é armazenado nas conexões, também designadas por ligações ou sinapses, entre nodos.

Como se entende, as redes neuronais são constituídas por ligações e, a cada uma delas, está associado um peso que será dinamicamente ajustado. Este ajustamento será feito durante todo o processo de aprendizagem e terá como referência o primordial o objetivo assente na classificação de forma correta e não ambígua dos registos estudados. O resultado final deste processamento representará um conjunto de regras que, no seu conjunto, procurarão expor de forma simples o conhecimento adquirido.

Existem algumas vantagens inerentes à utilização de redes neuronais artificiais que diferenciam este método de todos os outros até agora expostos. Estas vantagens são:

 facilidade em se poder inserir nova informação obtida sob a forma de processos automáticos;

 capacidade de se poder encontrar conhecimento para o qual as redes não foram treinadas;

 disponibilidade para poderem produzir respostas lineares ou não lineares;

 grande tolerância a falhas que possam ocorrer no decorrer do processo, devido à sua natureza de funcionamento paralelo.

Por todas estas vantagens, mas não só, as redes neuronais artificiais têm sido estudadas e utilizadas de forma muita ampla por investigadores e criadores de aplicações que visem a obtenção de conhecimento. Estes sistemas complexos têm contudo uma desvantagem que os torna negativamente diferenciadores dos restantes para conseguirem atingir resultados de qualidade é preciso gastar-se bastante tempo durante o processo de treino. De facto, neste modelo, o treino constituiu uma necessidade fundamental para que se consiga depois operar os cálculos de obtenção de informação de interesse.

Existe ainda outra metodologia que pode ser seguida e que resulta da conjugação com uma outra já avançada no âmbito dos algoritmos que visam tarefas de procura de informação associativa, tendo agora como papel principal a classificação de valores. Este algoritmo descrito assenta em classificação por regras de associação e procura inferir a distribuição de registos por grupos através de dados previamente agrupados. Esta metodologia é constituída por uma primeira fase assente na análise de dados de treino que, assim, procura obter os itens encontrados de forma mais frequente. Depois de feita esta primeira abordagem, os itens evidenciados são usados para, como explicado acima, serem geradas regras que permitam recolher conhecimento de regras associativas comuns. Este algoritmo tem a vantagem de usar um conceito de fácil entendimento e que requer uma preparação de informação não tão cuidadosa, pois consegue construir resultados a partir de diferentes estruturas de dados.

Este conjunto de métodos abordados constitui alguns exemplos de algoritmos a seguir quando se tem como objetivo agrupar registos em classes disponibilizando, desta forma, informação histórica de dados devidamente agrupados. A seguir será feita uma abordagem a alguns algoritmos que poderão ser utilizados quando se tem como meta a predição de valores futuros.

In document Kvinner i kommunestyrene (sider 35-40)