8 ANALYSE
8.2 Teknologi og Arbeidsplassløsninger
8.2.3 Mobilitet
Consideram-se relevantes duas conclusões com relação ao trabalho realiza- do: (i) a expectativa de se ter os subsídios necessários para a geração de uma clas- sificação padrão que viesse a resolver os problemas da proliferação de múltiplas legendas para o mapeamento dos solos do Cerrado foi satisfeita; e (ii) a aplicação e métodos de geração de agrupamentos baseado em palavras em um domínio bem comportado (com palavras padronizadas) revelou-se uma estratégia acertada. Outro aspecto importante observado foi a necessidade de um envolvimento intenso dos especialistas em no processo de análise, provendo informações fundamentais para o pré-processamento dos textos (normalização, correções e formatação) e na fase de geração da configuração preliminar de agrupamentos.
Dentre os trabalhos futuros possíveis, destaca-se a necessidade, já mencio- nada, de aplicação dos resultados alcançados em um esforço de pesquisa dos es- pecialistas em Pedologia, e a possibilidade de uso de sistemas geográficos de in- formação (SIG) para manipulação da informação obtida. Um SIG, neste caso, pode- ria auxiliar, por exemplo, na criação de planos de informação para as cartas envolvi- das (as 28 originais e a padrão), permitindo a verificação de consistência entre as mesmas.
Adicionalmente, a aplicação do método descrito em outros domínios que a- presentem problemas similares ao abordado nesta pesquisa apresenta-se como uma alternativa para trabalhos futuros.
REFERÊNCIAS BIBLIOGRÁFICAS
______. Text Mining for Organizacional Intelligence: A Case Study On A Public News Agency. In: Proceedings of the 5th International Conference on Enterprise Information Systems (ICEIS 2003), Angers (França), 2002b.
______. Text mining: crossing the chasm between the academy end the industry. In: DM2002 - Third International CONFERENCE ON DATA MINING METHODS AND DATABASES FOR ENGINEERING, Proceedings... Finance and Other Fields – Data Mining 2002, Bologna. WIT Press, 2002. p. 351-361.
ALBRECHT, R.; MERKL, D. Knowledge discovery in literature data bases. Library and Information Services in Astronomy III. ASP Conference Series, vol. 153, 1998. Disponível em: <http://www.stsci.edu/stsci/meetings/lisa3/albrechtr1.html>. Acesso em: 04/2008
AMABIS, J. M.; MARTHO, G. R. Biologia dos organismos: classificação, estrutura e função nos seres vivos. São Paulo: Moderna, 1996.
AZEREDO, L. C. L. Text Mining: Encontrando Sentido na Teia de Informações Não- Estruturadas. Departamento de Administração, Centro de Ciências Gerenciais do Planalto Central. Brasília: CIGEPLAC. 2002. 13p.
BAKEL, B. Modern classical document indexing a linguistic contribution to knowledge-based IR. Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR '98), ACM, v.p. 333-334, 1998.
BLOOM, B. S. Taxonomy of educational objectives: the classification of educational goals: handbook I, Cognitive Domain. New York: Longmans, Green, 1956.
BUSSAB, W. De O., MIAZAKI, E. S., ANDRADE, D.F. Introdução à Análise de Agrupamentos. SIMPÓSIO NACIONAL DE PROBABILIDADE E ESTATÍSTICA, 9. Anais... São Paulo: Associação Brasileira de Estatística. 1990. p105.
CAMPOS, M. L. A; GOMES, H. E. Taxonomia e Classificação: a categorização como princípio. In: ENANCIB – Encontro Nacional de Pesquisa em Ciência da Informação, 8. Anais... Salvador, 2007.
CASTILHO, W. F. et. all. An Interpretation Process for Clustering Analysis Based on Ontology of Language. In: PRADO, H. A. do; FERNEDA, E. Emerging technologies of text mining: techniques and applications, Anais... Hershhey (PA): Idea Group Reference, 2007. p. 297-320.
CHAKRAVARTHY, A. S.; HAASE, K. B. N. Using knowledge to find Internet information archives. In: INTERNATIONAL ACM-SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMATION RETRIEVAL.
CHEN, H. et al. A concept space approach to addressing the vocabulary problem in scientific information retrieval: an experiment on the worm community system. MIS Department, University of Arizona, 2 Jul. 1996. Disponível em:
http://ai.bpa.arizona.edu/papers/.
CHEN, H. et. al. Internet browsing and searching: User evaluations of category map and concept space techniques. Journal of the American Society for Information Sciences (JASIS), vol. 49, n. 7, p. 582-603. Disponível em: <ftp://ftp-
fc.sc.egov.usda.gov/NSSC/Soil_Taxonomy/keys/keys.pdf>.
CHEN, H. Knowledge management systems: a text mining perspective. Tucson, Arizona: University of Arizona, 2001. Knowledge Computing Corporation.
DELEN, D.; CROSSLAND, M. D. Seeding the survey analysis of research literature with text mining. Expert Systems with Applications: An International Journal, v. 34, n. 3, p. 1707-1720, 2008. Disponível em:
<http://portal.acm.org/citation.cfm?id=1327809&dl=GUIDE&coll=GUIDE& CFID=30499754&CFTOKEN=93320793>. Acesso em: mar/2008.
DIDAY, E.; SIMON, J. C. Clustering Analysis. In: Digital Pattern Recognition, K. S. Fu, Ed. Springer-Verlag, Secaucus, NJ, 47-94. 1976.
DIXON, M. An Overview of Document Mining Technology, 1997. Disponível em: <www.geocities.com/ResearchTriangle/Thinktank/1997/mark/writings/dm.html>. FELDMAN R.; DAGAN I. KDT - Knowledge Discovery in Texts. Proceedings of the First International Conference on Knowledge Discovery (KDD-95), 1995.
FELDMAN, R.; DAGAN, I. Knowledge discovery in textual databases (KDT). Journal of Intelligent Information Systems v. 10, n. 3, p. 281-300, 1998.
FERNEDA, E. Geração automática de thesaurus retangular. UFP 1997, Dissertação de Mestrado, Tecnologia da Informação. Universidade Federal da Paraíba, 1997. FOX, C. Information retrieval: data structures and algorithms book contents. Upper Saddle River, NJ, Prentice-Hall, Inc. USA, 1992.
FOX, C. Lexical Analysis and Stoplists. In: FRAKES, W. B.; BAEZA-YATES, R. A. (Ed.). Information retrieval: data structures & algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p. 102-130.
FOX, E. A.; INGWERSEN; FIDEL, R. Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 18 Proceedings... Seattle, Washington. USA, jul/1995. p. 9-13.
GONNET, G. H, BAEZA-YATES, SNIDER, T. New indices for text: Pat trees and Pat arrays, In: INFORMATION RETRIEVAL – Data Structures & Algorithms, New
Jersey: PRENTICE HALL, 1992. p. 66-82.
GRISHAM, R. Computational linguistics: An Introduction. Cambridge: Cambridge University Press, 1992.
HAIR, J. F. et. al. Multivalorate data analysis. 5th. Edition.Prentice-Hall, Inc. 1998. HALKIDI M., BATISTAKIS, Y., VAZIRGIANNIS M. Clustering validity checking methods: part II. ACM SIGMOD Record. v.31, p. 19-27, New York, NY, USA 2002. HARTIGAN, J. Clustering Algorithms. New York, NY: [Wiley, 1995].
HEARST, M. A. Untangling Text Data Mining. Proceedings of the 37th Annual Meeting of the Association for Computational Linguistics (ACL'99), University of Maryland, 1999 (invited paper). Disponível em:
<http://www.sims.berkeley.edu/~hearst>. Acesso em: 07/2008
HILDENISE, F. N. A Elaboração de taxonomias: princípios classificatórios para domínios interdisciplinares. n.f. 2007 [Rio de Janeiro: UFF, 2007] Dissertação (Mestrado em Ciência da Informação).
INSTITUTO BRASILEIRO DE GEOGRAFIA E EST.ATÌSTICA, Levantamento e Mapeamento de Solos. Disponível em: <http://geoflora.googlepages.com/ LEVANTAMENTOEMAPEAMENTODESOLOS.pdf>. Acesso em: 03/2008
JACOMINE, P.K.T.; CAMARGO, M.N. Classificação pedológica nacional em vigor. ln: ALVAREZ V., V.H.; FONTES, L.E.F.; FONTES, M.P.F. (Eds.). O solo nos
grandes domínios morfoclimáticos do Brasil e o desenvolvimento sustentado. Viçosa : Sociedade Brasileira de Ciência do Solo, Universidade Federal de Viçosa, 1996. p. 675-688.
JAIN, A. K.; MURTY, M. N.; FLYNN, P. J. Data clustering: a review. ACM Computer Surveys. v. 31, n. 3, p.264–323, 1999.
JOHNSTON, R. Analytic Culture in the U.S. Intelligence Community: an ethnographic study. Washington DC: [Center for the Study of Intelligence. Central Intelligence Agency, 2005].
KORFHAGE, Robert R. Information retrieval and storage. [S.l.]: John Wiley & Sons, 1997.
KOWALSKI, G. Information retrieval systems: theory and implementation. Boston: Kluwer Academic Publishers, 1997.
KROEZE, H.; MATTHEE, M. C.; BOTHMA, T. J. D. Differentiating between data- mining and text-mining terminology. South African Journal of Information Management, v. 6, n. 4, p. 1-14. Disponível em:
<http://www.up.ac.za/dspace/handle/2263/3127>. Acesso em: 05/2008
LANCASTER, F. W. Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos,1993.
LIU, Y., LOH T. H., LU W. F. Deriving Taxonomy from Documents at Sentence Level. In: PRADO, H. A. do, FERNEDA, E. Emerging Technologies of Text Mining: Techniques and Applications. Hershhey (PA): Idea Group Reference, 2007. p. 99- 119.
LOH, S. Intext Mining Suite v.2.3.4: Manual do Software. In: Text Mining Ltda, 2008. Disponível em:
http://www.intext.com.br/resources/multimidia/files/textmining/manual-tms.pdf LOH, S.; WIVES, L. K.; PALAZZO, J. M. O. Descoberta proativa de conhecimento em coleções textuais: iniciando sem hipóteses. In: OFICINA DE INTELIGÊNCIA ARTIFICIAL (OIA), 4, Anais ... Pelotas: EDUCAT, 2000. p. 143-154.
LOH, S.; WIVES, L.K.; PALAZZO, J.M. O. Descoberta proativa de conhecimento em textos: aplicações em inteligência competitiva. In: INTERNATIONAL SYMPOSIUM ON KNOWLEDGE MANAGEMENT/DOCUMENT MANAGEMENT (ISKM/DM 2000), 3, Proceedings ... Curitiba: PUC-PR, 2000a. p. 125-147.
LU, H.; MOTODA, H.; LIU, H. KDD: Techniques and Applications. The First Pacific- Asia Conference on Knowledge Discovery and Data Mining (Hardcover). Pacific-Asia CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING, 1997. p. 274. MATSUBARA, E. T.; MONARD, M. C.; PRATI, R. C. Exploring Unclassified Texts Using Multiview Semisupervised Learning. In: PRADO, H. A. do, FERNEDA, E. Emerging Technologies of Text Mining: techniques and applications, Hershhey (PA): Idea Group Reference, 2007. p. 139-161.
MICHALSKI, R. S.; STEPP, R. E. Learning from observation: conceptual ring. In: MICHALSKI, R.S. et al. Machine Learning: An Artificial Intelligence Approach, 1993. p. 30-40.
MILLER, T. W. Text Mining. In: MILLER, T. W. Data and Text Mining: a business application approach, New Jersey: Pearson Education, 2005. p. 103-124.
MORESI, E. A. D. Manual de metodologia da pesquisa. Universidade Católica de Brasília, Brasília-DF, 2003.
MOULIN, B.; MOULIN, D. Automated knowledge acquisition from regulatory texts. IEEE Expert, v. 7, n. 5, 1992. p. 27-35.
MOURA, M. F. Proposta de utilização de mineração de textos para seleção, classificação e qualificação de documentos. São Paulo, Campinas, Embrapa Informática Agropecuária, 2004. Dez/2004. p. 123-140.
NASUKAWA, T; NAGANO T. Text Analysis and Knowledge Mining System. IBM Systems Journal, v. 40, n. 4, p. 967-984, 2001.
NOVO, H. F. A Elaboração de Taxonomia: Princípios Classificatórios para Domínios Interdisciplinares. 172p. 2007. Dissertação. (Mestrado em Ciência da Informação). [Rio de Janeiro UFF/IBICT, 2007].
OLIVEIRA, H. M. Seleção de entes complexos usando lógica difusa. Porto Alegre: Instituto de Informática da PUC-RS, Dissertação de mestrado (Ciência da
Informação). 1996.
PALAZZO, J. M. O.; SCARINCI, R. G. Extração de informação como base para descoberta de conhecimento em dados não estruturados. WORKSHOP INTERNO
SOBRE DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS, I, Anais... jul/ 2000. Porto Alegre: CPGCC da Universidade Federal do Rio Grande do Sul, 2000. p. 174.
PEAT, H. J.; WILLET, P. The limitations of term co-occurence data for query expansion in document retrieval systems. Journal of the American Society for Information Science (JAS), v. 42, p. 378-383, 1991. Disponível em:
<http://www.iro.umontreal.ca/~nie/IFT6255/Peat_Willett_QExp.pdf>. Acesso em: 07/2008.
PINTO, A. M. Mineração de textos e gestão do conhecimento: aplicação na
experiência operacional em geração de energia nuclear nas Usinas de Angra I e II. 2007. 369f. Tese (Doutorado em Ciência da Informação) - Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2007.
PRADO, H.; FRIGERI, S. R.; MACHADO, K. F.; ENGEL, P. M. Data mining using combinatorial neural model. Revista Tecnologia da Informação. Brasília: Universa, v. 1, n. 1, p. 16-21, 1999.
PRADO, H.; HIRTLE, S. C.; ENGEL, P. M. Clustering Algorithms for Data Mining. Revista Tecnologia da Informação. v. 2, n. 1, p. 51-58, Brasília: Universa, 2000. RAJARAMAN, K.; PAN, H. Document Clustering using 3-tuples. PRICAI'2000 INTERNATIONAL WORKSHOP ON TEXT AND WEB MINING. Sep. 2000, Melbourne, Australia. Disponível em: <http://www.informatik.uni-
trier.de/~ley/db/conf/pricai/twm2000.html>. Acesso em: 06/2008. RIJSBERGEN, C. J. V. Information Retrieval. 1979. Disponível em: <http://www.dcs.gla.ac.uk/Keith/Preface.html> . Acesso em: 08/2008.
RILOFF, E. Little Words Can Make a Big Difference for Text Classifications. ANNUAL INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH AND
DEVELOPMENT IN INFORMATION RETRIEVAL, [18th] Proceedings... Seattle, Washington. USA. 9-13, Julho.1995.
ROB, P.; CORONEL, C. Database Systems: design, implementation, and management, 6ª. ed. Boston, MA: Course Technology, 2003.
SALTON, G.; MCGILL, M. J. Introduction to Modern Information Retrieval. New York, NY: McGraw-Hill, 1983.
SILVA, E. M. Descoberta do Conhecimento com o uso de Text Mining: Cruzando o Abismo de Moore. 2002, 174f. Dissertação (Mestrado em Gestão do Conhecimento e da Tecnologia da Informação). Brasília: UCB, 2002.
SILVA, E. M.; PRADO, H. A. do; FERNEDA, E. Suporte à criação de Inteligência Organizacional em uma Empresa Pública de Jornalismo com o uso de Mineração de Textos. In: WORKSHOP BRASILEIRO DE INTELIGÊNCIA COMPETITIVA E
GESTÃO DO CONHECIMENTO (KMBrasil 2002), 3, Anais... CONGRESSO ANUAL DA SOCIEDADE BRASILEIRA DE GESTÃO DO CONHECIMENTO, São Paulo (SP), 2002. p. 5-20.
SILVA, F. C. et. al. Banco de Dados de Experimentos Agrícolas: Visão de Análise. Revista Tecnologia da Informação, v. 2, n. 1, p. 59-66. Brasília: Universa, 2000. SILVERSTEIN , C.; PEDERSEN, J. O. Almost-constant time clustering of arbitrary corpus subsets. In Proceedings of the 20th International ACM SIGIR Conference on Research and Development in Information Retrieval, pages 60-66, 1997.
SOIL SURVEY STAFF.Soil Taxonomy: A Basic System of Soil Classification for Making and Interpreting Soil Survey: [2nd] Washington, DC: 1999.
SPENCER, H. The Study of Sociology. New York: D. Appleton, 1874.
SULLIVAN, D. The Need for Text Mining in Business Intelligence. Information Management Magazine, dez/2000. Disponível em: <http://www.information- management.com/issues/20001201/2791-1.html>. Acesso em: 05/2008.
TAN, A.-H. Text mining: The state of the art and the challenges. In: Proceddings... PAKDD'99 WORKSHOP ON KNOWLEDGE DISCOVERY FROM ADVANCED DATABASES, Beijing, p. 65-70, 1999. Disponível em:
<http://www3.ntu.edu.sg/home/asahtan/Papers/tm_pakdd99.pdf>. Acesso em: 11/2008.
TIKK, D.; BIRÓ, G.; TÖRCSVÁRI, A. A Hierarchical Online Classifier for Patent Categorization. In: PRADO, H. A. do, FERNEDA, E. Emerging Technologies of Text Mining: Techniques and Applications. Hershhey (PA): Idea Group Reference, 2007. p. 244-267.
TYRON, R. C. Cluster Analysis. Ann Arbor, MI: Edwards Brothers.1939.
UNITED STATES DEPARTMENT OF AGRICULTURE. Soil Survey Staff. 2006. Keys to Soil Taxonomy, 10th ed. USDA-Natural Resources Conservation Service,
Washington, DC. Disponível em: <ftp://ftp-
fc.sc.egov.usda.gov/NSSC/Soil_Taxonomy/keys/keys.pdf>. Acesso em: 09/2008. WILLET, P. Recent trends in hierarchical document clustering: a critical review. Information Processing and Management, v.24, N. 5, 1988. p. 409-435. WIVES, L. K. Um estudo sobre Agrupamentos de Documentos Textuais em Processamento de Informações não Estruturais Usando Técnicas de “clustering”. Porto Alegre: UFRS. Dissertação (Mestrado em Ciência da Computação). 1999. n.f. 1999.
WIVES, L. K.; LOH, S. Tecnologias de descoberta de conhecimento em informações textuais: ênfase em agrupamento de informações, Porto Alegre: CPGCC da UFRGS. Disponível em: <http://www.leandro.wives.nom.br/pt-
br/publicacoes/dissertacao.pdf>. Acesso em: 10/2008.
WIVES, L. K.; OLIVEIRA, J. P. M.; LOH, S. Conceptual Clustering of Textual Documents and Some Insights for Knowledge Discovery. In: PRADO, H. A. do, FERNEDA, E. Emerging Technologies of Text Mining: Techniques and Applications. Hershhey (PA): Idea Group Reference, 2007. p. 223-243.
YATES-BAEZA, R. An extended model for full text databases. Journal of the Brazilian Computer Society, v.2, n.3, abr/1996. p. 327-337.
ZADEH, L. A. Fuzzy Sets. Outline of a New Approach to Analysis of Complex and Decision Processes. IEEE Transactions on System, Man and Cybernetics 3, v. 3, n. 1, p. 28-44, jan/1973.