Vedlegg 2. Forutsetninger for regresjonsanalyser
2. Kunnskap om samarbeid
56
Figura 25 - Metodologia utilizada para análise conceptual
Para a análise conceptual do domínio ECM começou-se por identificar os três tipos do corpora (já identificado no ponto anterior: 3.1.2 Ferramentas e Recursos: corpus da AIIM, corpus científico e corpus Gartner Inc.) e, de seguida, recolheram-se todos os textos, em formato PDF. Após a recolha dos textos, levou- se a cabo a conversão dos mesmos, para texto simples (txt) para que o processo de extracção terminológica ficasse menos pesado.
No sentido de verificar diferenças entre as três tipologias de textos decidiu-se levar a cabo o processo de extracção terminológica separadamente e por fases, ou seja, dividiu-se o corpus total pelos três tipos diferentes, sendo que a
57 representação conceptual final diria sempre respeito ao contributo do corpus total e não isolado.
De seguida, levou-se a cabo o processo de extracção terminológica usando a ferramenta, já apresentada, TermExtractor cumprindo todas as fases do processo já descritas, também, no ponto anterior. É importante destacar que se preferiu delimitar a string entre um mínimo de 1 e um máximo de 5 palavras. Os resultados de cada processo de extracção foram relativamente proporcionais à quantidade de textos inseridos. Desta forma, para o corpus da AIIM, o resultado foi de 450 candidatos a termos; para os textos científicos o resultado foi cerca de 80 candidatos a termos; e para os textos da Gartner Inc. o resultado foi 295 candidatos a termos.
Posteriormente levou-se a cabo a filtragem dos candidatos a termos onde se considerou apenas a ordenação pela medida “peso” (combinação linear balanceada da pertinência do domínio(DR , consenso do domínio ) (DC , coesão ) lexical ((LeC e relevância estrutural), já apresentada no ponto anterior. O ) critério foi considerar apenas os termos com o peso superior a 0,6, sendo que, por exemplo, no caso da extracção dos textos da AIIM, dos cerca de 450 candidatos a termos, apenas 270 foram considerados. (Anexo VI Lista de Termos Considerados)
Numa fase seguinte os candidatos a termos considerados foram novamente filtrados através da eliminação de termos sinónimos; directamente relacionados com empresas, pessoas ou soluções de software; e irrelevantes para a análise. A principal razão deveu-se a termos com significados iguais (que levou a escolha apenas de um), por exemplo, “regulatory compliance”, “civil procedure”, “federal rule”, “federal rule of civil procedure”, “compliance requirement”, “legal
hold”, “retention period”, “legal counsel”, “retention requirement”, “legal proceeding”, “legal issue” são termos extraídos que, neste contexto, referem-se
todos à questão de obrigatoriedade legal e civil das organizações guardarem por um determinado período de tempo documentação (nomeadamente fiscal, por exemplo). Outro dos problemas, foram as palavras bastante comuns no domínio como, por exemplo, “Cellphone”, “computer”, “desktop”, “Screen”, “laptop” que, por terem uma frequência bastante alta ficavam com um peso relevante, mas que, para esta representação não o eram. Poderemos ainda referir a questão dos nomes próprios, uma vez que os erros de formatação do texto levaram também a
58
extracção de termos como, por exemplo, os nomes próprios (de autores, empresas, etc) que por não estarem escritos em maiúscula eram extraídos.
Figura 26 – Exemplo Resultados TermExtractor análise corpus AIIM (candidatos a termos)
Repetiu-se o mesmo procedimento para cada tipo de corpus e, de seguida, levou- se a cabo o processo de validação dos termos e conceptualização. Nesta fase, foi essencial o posicionamento da autora como conhecedora do domínio ECM, em que se procurou dar um “input” ao avaliar os termos, transformando-os em conceitos. Esta foi uma fase delicada onde se procurou agrupar todos os conceitos escolhidos através de todos os termos recolhidos, dos três tipos de corpus, hierarquizá-los e estabelecer, por meio de preposições, relações entre os mesmos, ligando os conceitos com proposições ou frases de ligação que explicassem a relação entre eles, tendo sempre o cuidado de não repetir conceitos e de estabelecer por meio de setas a direcção de cada relação.
Ao mesmo tempo que se realizou o processo de conceptualização do domínio, foi realizado um mapa conceptual, recorrendo à ferramenta CmapTools, onde se procurou representar o mesmo.
Por fim, e não sendo considerada para este trabalho uma especialista do domínio, fez parte deste método, a realização de uma validação da representação conceptual desenvolvida consultando algumas pessoas que se consideraram ter conhecimento do domínio e alguma experiência profissional do mesmo. Optou-se por questionar cinco pessoas enviando o mapa conceptual do domínio ECM, acompanhada com uma breve introdução sobre o que é um mapa conceptual. As pessoas foram convidadas a ler a analisar a representação e a responder se considerarem que o mapa conceptual “representa de forma insuficiente”, “representa de forma suficiente” ou “representa de forma relevante” e dando também a oportunidade a comentários sobre correcções ou sugestões de melhoria.
59 As seis pessoas a quem se solicitou a validação da representação conceptual elaborada são todas profissionais da informação: duas da vertente mais científica e académica, duas de um lado mais empresarial, com experiência em implementação de soluções e em consultoria relacionadas com Gestão da Informação Empresarial; uma com experiência profissional mais direccionada para o ramo da consultoria em BPM e do ramo industrial; e uma com experiencia em Gestão da Informação, mas mais direccionada para organismos públicos.
Depois de recebidas as respectivas classificações, assim como sugestões de alteração e melhoria da representação apresentada, as mesmas foram registadas individualmente (por pessoa) em mapas à parte (onde a verde estão representados novos conceitos; a laranja conceitos que sofreram alterações; a vermelho conceitos que deverão excluídos).
Por fim, analisaram-se todas as sugestões e correcções propostas e alterou-se o mapa fundindo as sugestões dos especialistas.