5 Teoretiske perspektiver og begreper
5.4 Karrierer for avvik og stigma
m´etrica empregada para medi-la. A m´etrica mais intuitiva ´e a distˆancia euclidiana, outras m´etricas s˜ao discutidas em fun¸c˜ao do dom´ınio e da natureza dos dados (GOWER; LE- GENDRE, 1986). Mesmo quando os atributos s˜ao representados por valores nominais (ex: vermelho, azul; autom´ovel, caminh˜ao; belo, feio), valores num´ericos podem ser atribu´ıdos atrav´es de assun¸c˜oes adicionais, ou at´e mesmo pela defini¸c˜ao de subatributos. Ex.: au- tom´ovel tem dois eixos, peso leve; belo se forma for arredondada (atributo “curvatura”), cor dada pela composi¸c˜ao percentual das cores prim´arias; e assim por diante.
Com a teoria dos conjuntos nebulosos (“fuzzy sets”) proposta por Zadeh (1965), um objeto pode ter v´arios graus de similaridade respectivamente a classes diferentes do mesmo espa¸co de atributos. Assim, um agrupamento convencional ´e bin´ario, levando um objeto a pertencer a um determinado grupo, e a n˜ao pertencer aos outros. Um agrupamento nebuloso admite fronteiras nebulosas entre os grupos, de modo que eles se sobreponham parcial ou at´e totalmente. Os grupos nebulosos permitem o tratamento mais adequado de objetos vagos, de classifica¸c˜ao incerta, minimizando e at´e evitando erros de classifica¸c˜ao. O cap´ıtulo 3 trata dos conjuntos nebulosos com maior profundidade, dado o problema abordado aqui nesta tese.
2.1.4
Constru¸c˜ao do classificador.
´E a parte mais complexa de um modelo de reconhecimento de padr˜oes. Um classificador determina uma parti¸c˜ao, convencional ou nebulosa, do espa¸co de atributos.
A diferen¸ca fundamental entre agrupamento e classifica¸c˜ao ´e que, naquele, as clas- ses s˜ao rotuladas ap´os a defini¸c˜ao dos grupos, enquanto que um classificador (uma vez constru´ıdo) rotula qualquer dado no espa¸co inteiro de atributos (BEZDEK; PAL, 1992). ´E importante ressaltar que o agrupamento revela similaridades entre objetos via atributos. Classificadores s˜ao geralmente, mas nem sempre, projetados com dados pr´e-rotulados, e as fun¸c˜oes de parti¸c˜ao podem ser expl´ıcitas (fun¸c˜oes anal´ıticas, regras, tabelas de consulta) ou impl´ıcitas (ex. “perceptrons”, vizinhos mais pr´oximos). Um exemplo de classificador que n˜ao seja projetado com dados pr´e-rotulados s˜ao as regras de inferˆencia em controle nebuloso, dadas por algum especialista humano conhecedor do processo.
Um processo de reconhecimento de padr˜oes est´a relacionado a uma etapa de clas- sifica¸c˜ao. Muitas vezes, ocorre que a constru¸c˜ao do classificador n˜ao ´e suficientemente acurada, pois quase sempre ´e dependente dos objetos dispon´ıveis em um dado espa¸co de atributos. Assim, um novo objeto pode ser incorretamente classificado, exigindo uma re-
2.1 Modelagem do processo de reconhecimento 26
vis˜ao dos parˆametros que descrevem o classificador. Os objetos que possibilitam o ajuste dos parˆametros do classificador s˜ao chamados dados de treinamento, representados pelos seus vetores de atributos. Enquanto os dados s˜ao representados por vetores de atributos, o classificador representa e armazena o conhecimento atrav´es de algoritmos, regras de decis˜ao ou tabelas de consulta.
O processo de buscar a melhor parti¸c˜ao do espa¸co de atributos em classes denomina-se constru¸c˜ao do classificador. Formalmente,
“dados os exemplos xk, representados pelos atributos xkℓ, e a classe ωi asso- ciada a cada exemplo, a constru¸c˜ao do classificador procura a melhor fun¸c˜ao de mapeamento f, de forma que ωi = f (xk)” (BEZDEK; PAL, 1992).
Pode-se pensar em classifica¸c˜ao como uma forma de regress˜ao tal que, nesta, f seja cont´ınua, e na classifica¸c˜ao, f ´e discreta – categorias ou classes (WEISS; INDURKHYA, 1995).
Aqui tamb´em existem quest˜oes b´asicas sobre o projeto do classificador, ap´os decidir os atributos julgados relevantes para a tarefa de classifica¸c˜ao:
• como construir o classificador? No exemplo mostrado pela fig. 2.1, uma curva de decis˜ao foi criada para particionar o espa¸co de atributos e permitir a classifica¸c˜ao de algum novo objeto que possa surgir. Esta curva ´e adequada? Realiza bem a tarefa de classifica¸c˜ao? Uma linha reta, de parametriza¸c˜ao mais simples, poderia ser adotada no lugar? A preocupa¸c˜ao aqui refere-se `a ado¸c˜ao de um crit´erio ´otimo para que o classificador atenda `as metas do problema;
• resolvida a quest˜ao de modelagem do classificador, como avaliar seu desempenho? Qual sua taxa de erro? Objetos escolhidos sob certos crit´erios constituem o chamado conjunto de teste, onde a classe de cada objeto ´e previamente conhecida e o resultado fornecido pelo classificador ´e comparado com o resultado desejado para cada objeto.
Constru¸c˜ao autˆonoma do classificador. Um modelo de constru¸c˜ao autˆonoma do classificador necessita das teorias de aprendizado computacional. No presente trabalho, a constru¸c˜ao do classificador usando as teorias de aprendizado computacional est´a voltada `a organiza¸c˜ao do conhecimento. Este conhecimento consiste em classificar corretamente instˆancias de conceitos vagos, e ´e adquirido de acordo com as fases envolvidas no reconhe- cimento de padr˜oes, mais um tratamento adequado da vaguidade intr´ınseca das instˆancias.
A organiza¸c˜ao deste conhecimento est´a na capacidade de um classificador represent´a-lo e armazen´a-lo para ser reutilizado.
A classifica¸c˜ao ´e uma tarefa de aprendizado b´asica e essencial. Conforme Mitchell (1997), o desempenho do classificador deve melhorar com o treinamento. Logo, aprender consiste em classificar corretamente os dados, com desempenho cada vez melhor. Classes obtidas atrav´es de dados utilizados como exemplos (ou n˜ao) definem os padr˜oes, e o reconhecimento de novos exemplos se d´a por algum processo comparativo. Assim, o classificador concebido sob os paradigmas de aprendizado em m´aquinas ir´a gerar classes cada vez mais precisas, atrav´es de ajustes no modelo. Monard (1997) e colegas compilaram alguns dos m´etodos de aprendizado computacional, classificando-os como:
a) simb´olico: voltado `a constru¸c˜ao de representa¸c˜oes simb´olicas de um conceito, atrav´es da an´alise dos exemplos e contra-exemplos. Estas representa¸c˜oes s˜ao dadas por express˜oes l´ogicas, ´arvores de decis˜ao, regras de produ¸c˜ao ou redes semˆanticas;
b) estat´ıstico: classificadores que operam sob este paradigma tˆem a assun¸c˜ao que os va- lores dos atributos seguem uma distribui¸c˜ao normal. Classificadores baseados na teoria de decis˜ao de Bayes se enquadram nesta categoria. Em geral, os vetores de atributos n˜ao s˜ao independentes, e as classes est˜ao relacionadas entre si;
c) baseado em instˆancias: novos dados s˜ao classificados utilizando dados similares t´ıpicos de cada classe. Al´em da escolha dos dados t´ıpicos, outros elementos deste paradigma s˜ao a fun¸c˜ao de similaridade, que informa o grau de separa¸c˜ao das classes, e a fun¸c˜ao de classifica¸c˜ao, que decide a qual classe um dado novo deve pertencer (AHA; KIBLER; ALBERT, 1991). ´E o mais usado;
d) conexionista: cujo modelo t´ıpico ´e o das redes neurais, que s˜ao inspiradas no modelo biol´ogico do sistema nervoso. Sua arquitetura baseia-se em unidades altamente interconectadas. O classificador resultante deste paradigma ´e constru´ıdo com uma representa¸c˜ao bin´aria ou cont´ınua dos dados, o n´umero correto de uni- dades de entrada e sa´ıda e o ajuste das conex˜oes entre as unidades (HAYKIN, 1999);
e) gen´etico: paradigma derivado do modelo evolucion´ario de aprendizado. O classificador ´e formado por elementos que competem para realizar a tarefa de predi¸c˜ao. Os elementos com maior taxa de erro (“mais fracos”) s˜ao descartados, enquanto