O trabalho de Peñalver-Martinez et al. (2014) apresenta uma proposta bastante similar ao trabalho de Lau, Li e Liao (2014), mas com foco na própria análise de sentimento. A Figura 54 foi extraída do trabalho original dos autores.
Figura 54 – Modelo proposto por Peñalver-Martinez et al. (2014)
Fonte: Peñalver-Martinez et al. (2014), p. 5999
Os reviews dos usuários são submetidos ao modelo e na sua primeira etapa tem-se o pré-processamento do texto utilizando ferramental da área do processamento de linguagem natural. O próximo passo envolve a busca na ontologia de domínio pelos conceitos (características dos serviços ou produtos) existentes no texto.
De posse dos conceitos envolvidos, busca-se no SentiWordNet os termos polares presentes no texto. A partir da contabilização dos termos polares por características, é calculada a polarização final e apresentada para o usuário.
O modelo desta tese se diferencia desse modelo exatamente da mesma forma que apresentada na Seção 4.5.2.1, ou seja, esse modelo não utiliza casos passados de forma a adaptar termos polares ambíguos e nem reutiliza classificações passadas como proposta de solução.
Na visão dos autores, uma das principais contribuições do trabalho é a ontologia gerada a partir da MovieOntology, que pode ser utilizada para novos trabalhos desse domínio na área da análise de sentimento.
A seção seguinte apresenta as considerações finais do presente capítulo.
4.6 CONSIDERAÇÕES FINAIS
O presente capítulo teve como objetivo avaliar o modelo inicial da tese, proposto após o levantamento do estado da arte e do referencial teórico. Para isso, foi concebido um recorte do modelo para atestar a viabilidade de trabalhar com a construção de uma árvore de conceitos e instâncias vindas de uma ontologia combinadas com termos polares vindos de um léxico de sentimento. Também se objetivou para esse primeiro experimento a possibilidade de armazenar os casos já processados a fim de utilizá-los em novas classificações (para isso utilizou-se RBC).
Após a implementação do protótipo baseado no recorte da proposta de solução, avaliou-se o seu uso aplicado ao domínio de comentários sobre câmeras digitais. O mesmo processo foi reproduzido utilizando SVM e NB, em que o modelo proposto obteve resultado superior após o processo de adequação da ontologia de domínio e do léxico utilizado.
Ao finalizar essa avaliação inicial do recorte do modelo proposto, percebeu-se que existiam pontos de melhoria. Tal constatação foi importante, pois permitiu a definição dos passos seguintes para o modelo em questão.
Percebeu-se que existia um problema no tratamento de termos ambíguos que podem ter uma conotação (polarização) para um domínio e outra completamente diferente para outro domínio. Desta forma, optou-se pela definição de um método para evoluir a base de conhecimento, trazendo todas as particularidades de mudança nas polarizações originais de termos do léxico geral, proposto por Hu e Liu (2004), para dentro da ontologia, tornando essa modificação uma característica do domínio.
Sabendo que o processo de adequação do léxico é algo bastante trabalhoso, construiu-se um processo automatizado para facilitar a
identificação e a adequação de termos polares em um novo domínio utilizando uma base de treinamento.
O mesmo processo de avaliação foi efetuado levando em consideração um novo domínio, dessa vez, de comentários de filmes vendidos no site da Amazon. A partir do ferramental construído para adequar as bases de conhecimento, chegou-se a definição da última etapa do modelo proposto, a adequação.
Foram construídas três formas distintas para adaptar um termo ambíguo baseado no seu contexto e nos casos já armazenados. A que obteve melhor resultado foi a técnica baseada no consumo de dados e de informações presentes nas matrizes SVD. Entretanto, o processo de decomposição matricial (SVD) é custoso e deve sofrer atualizações de tempos em tempos. Caso esses requisitos não sejam viáveis, o método baseado na frequência dos termos pode ser utilizado com resultados satisfatórios.
Considerando o modelo proposto final, foram efetuadas mais avaliações baseadas nos dois domínios já trabalhados, comparando os resultados com o SVM e NB e obtendo resultados superiores.
Por fim, optou-se por atualizar a revisão sistemática e apresentar novamente o estado da arte. Verificou-se com isso que a lacuna que esse trabalho procura atender continua aberta. Essa conclusão pode ser percebida por meio da análise de trabalhos com abordagens similares como os apresentados nas Seções 4.5.2.1 e 4.5.2.2.
Observou-se que, principalmente as etapas de recuperação e adaptação, do modelo proposto, não estão sendo ainda tratadas em outros trabalhos neste contexto. Para isso, atribui-se o uso do RBC e das matrizes SVD utilizando como base os casos armazenados.
O RBC (base de casos) contribui de duas maneiras para o modelo da tese: (1) ao recuperar um caso inteiro como proposta de solução, bem como, (2) na etapa de adaptação, na qual é possível, a partir dos termos ambíguos, utilizar parte de classificações passadas para auxiliar na polarização de um novo caso.
O próximo capítulo tem como objetivo apresentar as conclusões e os trabalhos futuros.
5 CONCLUSÕES E TRABALHOS FUTUROS
Este capítulo tem como objetivo apresentar as conclusões obtidas durante o processo de desenvolvimento deste trabalho por meio das etapas de avaliação e análise dos resultados do modelo proposto.
Além das conclusões, também são apresentados os trabalhos futuros. A produção bibliográfica gerada durante o processo de doutoramento pode ser consultada no Apêndice deste trabalho.