8 ANALYSE
8.1 Bedriftskultur og visjon
8.1.3 Ledelse og kultur
O termo taxonomia surgiu na área da Biologia como uma forma de classifica- ção dos seres vivos, focando nas diferenças e semelhanças dos organismos. Se- gundo Amabis e Martho (1996):
[...] a taxonomia (do grego taxon, categoria, grupo, e nomos, conhe- cimento) é o ramo da biologia que se ocupa da classificação e da nomenclatura dos seres vivos.
O termo taxonomia refere-se à tarefa de classificação, sendo um processo fundamental em qualquer ciência. A taxonomia não somente significa impor ordem
na diversidade entre os objetos e conceitos como também contribui para o desen- volvimento rigorosamente sistemático de pesquisas científicas. Classificações de solos, por exemplo, são indispensáveis para pesquisas na área de Pedologia (ARIZONA BOARD OF REGENTS, 2008).
Para Willet (1998), a vinculação de um determinado texto a uma partição ta- xonômica representa uma tarefa de classificação. A partir de um conjunto predefini- do de categorias, busca-se identificar a qual delas um texto pertence. Para Miller (2005):
[...] a categorização de textos envolve a identificação de característi- cas comuns entre os documentos e organiza esses documentos em grupos com base em suas características comuns. A categorização de textos é um importante componente de muitas aplicações de MT, incluindo as que envolvem recuperação da informação e medição de textos.
Algumas ferramentas de busca na Web aplicam fortemente técnicas de medi- ção de textos e recuperação da informação (WIVES, OLIVEIRA e LOH, 2007). Se- gundo Miller (2005), essas ferramentas de pesquisa se confundem com suas técni- cas de recuperação da informação. A tarefa fundamental dessas ferramentas consis- te em criar uma simetria entre as consultas dos usuários e os documentos recupera- dos. Segundo esse autor, ferramentas de pesquisa podem ser classificadas em fer- ramentas de alta precisão ou de alta recuperação. As primeiras retornam apenas documentos relevantes para uma determinada consulta. As outras retornam tanto documentos relevantes como irrelevantes, e mesmo aqueles indiretamente relacio- nados para a informação requisitada.
Miller (2005) afirma que MT “é a pontuação sobre um atributo que descreve um texto”. Segundo Roberts e Popping (apud MILLER, 2005), apesar de medição de texto ser um termo recente, muitos exemplos desse tipo de análise de texto já exis- tem com outros nomes, tais como análise de conteúdo e temática, semântica, e aná- lise de textos em rede. West (apud MILLER, 2005) identifica, nos últimos anos, um crescente interesse no campo de análise de conteúdo. Na Figura 7, são apresenta- das das técnicas aplicadas em mineração de textos.
Análise de agrupamentos Categorização/classificação de textos Medição de Textos Figura 7: Técnicas aplicadas em mineração de textos
2.2.1 Sistema Brasileiro de Classificação de Solos
O Sistema Brasileiro de Classificação de Solos (SiBCS) é um referencial ta- xonômico usado pelas comunidades técnica, acadêmica e científica envolvidas com o domínio da Pedologia. No Brasil, a classificação de solos iniciou-se por volta de 1947, tendo como base um modelo americano proposto em 1938 e com diversas revisões depois disso (JACOMINE e CAMARGO, 1996).
Os conceitos centrais do antigo sistema americano formam a base da atual classificação brasileira transmudada, cuja esquematização atual descende de modificações de critérios, alteração de conceitos, criação de classes novas, desmembramento de algumas classes ori- ginais e formalização de reconhecimento de subclasses de natureza transicional ou intermediárias. O processo foi sempre motivado pela apropriação das modificações às carências que se iam revelando, com a realização de levantamentos em escalas médias e pequenas, em que concorriam classes de categorias hierárquicas mais eleva- das. O enfoque principal sempre esteve dirigido ao nível hierárquico de grandes grupos de solos, aliado ao exercício da criatividade tenta- tiva no que corresponde ao nível de subgrupo, posto que classes dessa categoria nunca foram estabelecidas no sistema primitivo. [...] Muitas concepções surgidas com a produção desse novo sistema vieram a ser absorvidas na classificação em uso no Brasil. Igualmen- te, alguns conceitos e critérios firmados no esquema referencial do mapa mundial de solos [...] foram também assimilados no desenvol- vimento da classificação nacional. (EMBRAPA, 1999).
Segundo o modelo atual, a hierarquia da classificação de solos considera as categorias de (i) ordem, (ii) subordem, (iii) grande grupo, (iv) subgrupo, (v) família e (vi) série. Na Tabela 1, são mostradas as ordens consideradas pelo SiBCS e as quantidades de subordens, grandes grupos e subgrupos a elas relacionadas.
2.2.2 A pedologia do Cerrado
uma área não contínua de 2 milhões de km² distribuídos nos estados do Amapá, Amazonas, Bahia, Distrito Federal, Goiás, Maranhão, Mato Grosso, Mato Grosso do Sul, Minas Gerais, Pará, Paraná, Rondônia, Roraima, São Paulo e Tocantins. A Fi- gura 8 ilustra a disposição do Cerrado no Brasil.
Tabela 1: Classes de solos do Sistema Brasileiro de Classificação de Solos
Ordem Sub-ordem Grande grupo Subgrupo
Alissolos 2 5 12 Argissolos 4 10 85 Cambissolos 3 17 69 Chernossolos 4 10 31 Espodossolos 2 6 27 Gleissolos 4 15 53 Latossolos 4 22 90 Luvissolos 2 5 23 Neossolos 4 18 59 Nitossolos 2 7 22 Organossolos 4 9 42 Planossolos 3 10 44 Plintossolos 3 8 28 Verissolos 3 11 40 TOTAL 44 153 625 Fonte: http://www.agencia.cnptia.embrapa.br/Repositorio/ Classificacao_solos_000fkr8n0ne02wyiv80sq98yq8hy4i3d.pdf
Figura 8: O bioma Cerrado
Fonte: http://br.geocities.com/cerrado_ms/cerrado.htm
Ao longo dos últimos 20 anos, diversas instituições realizaram classificações de solos na região do Cerrado utilizando um conjunto de palavras padronizadas para
gerar legendas. Entretanto, cada instituição descreveu diferentemente as classes encontradas, levando à proliferação de legendas e rótulos distintos. O problema a ser tratado refere-se ao tratamento dessa proliferação de legendas e rótulos para um mesmo tipo de solo do Cerrado, de modo a gerar subsídios aos especialistas para uma padronização dessas legendas e rótulos.
O sistema de solos do Cerrado não possui uma padronização específica para a classificação das legendas contidas nas 28 grupos de cartas, divididas e represen- tadas em 28 regiões diferentes para cada tipo de solo associado. A estrutura de descrição das legendas das 28 regiões é representada em três níveis: (i) a identifi- cação da carta (Ex.: "CARTA01"), (ii) a identificação da legenda (Ex.: "CARTA01.AQd") e (iii) de descrição da legenda propriamente dita (Ex.: "AREIAS QUARTZOSAS ÁLICAS A moderado fase cerrado subcaducifólio relevo plano e su- ave ondulado").
Cada região possui um grupo de cartas associadas a ela. Em um nível inferi- or, tem-se o conteúdo descritivo dessas cartas (as legendas), que podem estar em um formato descritivo simples (Unidades Simples - US) ou composto (Unidades de Mapeamento - UM). Cada UM é composta de duas ou mais US. A Figura 9 ilustra a disposição hierárquica dos objetos no mapeamento de solos.
Figura 9: Níveis de organização
Nesse cenário, verificou-se a necessidade de uma reorganização das legen- das das cartas, agrupando as semelhantes sob um mesmo rótulo. Essa nova orga- nização tem um formado do tipo “de-para”, onde é possível identificar qual legenda ou grupo de legendas antigas estão representadas em um determinado grupo.