1. INTRODUCTION
1.4 D ELAYED SLEEP PHASE DISORDER
1.4.3 Daytime function and sleepiness
Não nos iremos alongar sobre a evolução das características que foi assumindo a Indexação desde as suas origens aos nossos dias, por dois motivos:
1) Não se trata do nosso objecto de estudo;
2) Sendo a Indexação uma área de estudo muito abordada e, convém referi-lo, de há muito tempo para cá, a sua abordagem traduzir-se-ia na deslocação do nosso objecto de estudo, sendo apenas um dos braços deste estudo.2
São geralmente considerados três tipos possíveis de indexação – a manual ou humana, a automática, e a semi-automática ou híbrida.
A indexação manual ou humana é feita por um técnico de informação com formação adequada à tarefa. Apesar de ser um processo mais lento, quando comparado com as outras duas formas possíveis, actualmente ainda é discutível que se torne mais onerosa. O trabalho do indexador exige tempo, mas também requere atenção, conhecimento, e atenção a variáveis, como relações de quase sinónimos, que podem não ser contempladas nos outros sistemas. É também um trabalho mais direcionado ao público-alvo, no sentido em que o indexador conhece a instituição em que se encontra inserido, e sabendo como melhor selecionar os termos de pesquisa e as necessidades de informação destes. Contudo, o fator tempo despendido não deixa de ser um entrave significativo a considerar.
Por contrapartida, a indexação automática é efetuada através de um sistema computadorizado, sem ação humana. Por um lado, o processo torna-se rápido e pouco oneroso, mas apresenta como principal óbice a perda de informação, como relações de quase sinonímia, ou como produção de ruído no retorno de uma pesquisa. É sempre a ação humana que predetermina os conceitos que a indexação automática recupera, mas tratando-se de um sistema rígido de reconhecimento de vocábulos, o risco de perda de informação ou de recuperação de ruído é demasiado acentuado.
18 O que se poderá considerar como ideal será um sistema semi-automático ou híbrido, que junta as vantagens da indexação manual com os benefícios da indexação automática. O sistema computadorizado recupera e identifica os termos para que foi programado, sendo depois efetuada uma verificação pelo profissional da informação, que pode alterar, acrescentar ou remover vocábulos. Esta técnica consome menos tempo que a indexação manual, mas mais tempo que a indexação automática. Contudo, a margem de erro, a eficiência na recuperação da informação, e a diminuição de ruído nas pesquisas crê-se justificar esta alternativa como preferencial.
Neste ponto, torna-se necessário fornecer uma definição de termo.
“Termo – Palavra ou conjunto de palavras utilizados para representar um conceito, prévia e rigorosamente definido, peculiar a uma ciência, arte, profissão, ofício, etc. || Prazo. Tempo determinado || Época em que deve efetuar-se qualquer coisa || Declaração exarada em processo || Elemento de oração || Fim. Remate. Conclusão (no tempo ou no espaço) || Palavra. Expressão. Vocábulo. Dicção || Teor. Forma. Redacção” (Novo Dicionário do Livro: da escrita ao multimédia, 1999: 581).
Os termos de indexação podem ser genéricos, específicos, compostos, de pesquisa, ou preferencial.
O termo genérico engloba toda uma área específica do conhecimento, como por exemplo as Ciências Humanas e Sociais, ao ponto que o termo específico se trata de um elemento subordinado hierarquicamente ao termo genérico, como Psicologia. Os termos compostos são junções de dois vocábulos, sem relação morfológica, de modo a traduzir um conceito, podendo ser genéricos ou específicos. Quando se trata vocábulos ou expressões a ser empregadas de forma recomendada, está-se perante um termo preferencial. Finalmente, os termos de pesquisa são palavras ou expressões que visam recuperar informação, num dado sistema onde esta se encontra alojada.
De salientar que as palavras-chave indicadas pelos autores nas suas publicações científicas não se tratam de termos de indexação, embora devam obedecer a alguns
19 princípios semelhantes, como traduzir clara e inequivocamente o assunto tratado no texto, como serem ordenados a partir do termo mais genérico para o mais específico, ou vice-versa. Apesar de algumas publicações científicas traduzirem estas palavras-chaves como termos de indexação, não é garantido que estas sejam capazes de recuperar a informação de forma eficiente, ou de evitar a produção de ruído. Será sempre preferível ter um indexador para verificação ou clarificação de termos.
“[Palabras clave] Lo más usual es que sean otorgadas por indizadores profesionales, a veces com asistencia informática. También pueden ser espeficicadas por los propios autores. Pero en general puede considerarse más una herramienta usada por el editor de la revista que por el próprio autor del trabajo.” (Maltrás Barba, 2003: 102).
Os termos de indexação obedecem a diferentes critérios de linguagem. Primeiramente, esta pode ser natural ou documental. A linguagem natural é a linguagem dita normal, ou seja, utilizada na comunicação do dia-a-dia, sem nenhum filtro ou controlo. As linguagens documentais baseiam-se na linguagem natural, para construir termos ou expressões que traduzam o conteúdo informacional de dado documento. Estas podem ser livres (não controladas) ou controladas. As primeiras permitem uma maior liberdade de pesquisa de informação, mas apresentam como desvantagem o retorno de ruído na pesquisa e a dificuldade em selecionar as expressões mais adequadas à pesquisa. Por oposição, as linguagens controladas são de uma estrutura rígida, traduzidas por vocábulos ou expressões de termos genéricos e específicos.
Há ainda a considerar as linguagens de estrutura categorial e as linguagens combinatórias. A linguagem de estrutura categorial é rígida e fortemente hierarquizada, baseando-se numa lógica dedutiva, e focada apenas num ponto de assunto do documento (Regedor, 2012: 135). As linguagens combinatórias são menos estruturadas, permitindo a inclusão de vários assuntos presentes no documento através dos termos de indexação, sendo assim mais versáteis e, genericamente, preferenciais aquelas de estrutura categorial. Enquanto as últimas estão mais presentes nas classificações, as linguagens combinatórias são refletidas em thesaurus.
20 PARTE II – A APLICAÇÃO DA LEI DE ZIPF NA PRÁTICA DA INDEXAÇÃO
21 1. O Latindex