• No results found

valor de informa¸c˜ao m´utua.

4.6

Classifica¸c˜ao de uma IPP

Uma vez que a rede bayesiana, B, j´a foi constru´ıda, a mesma ser´a usada para extrair uma IPP a partir de uma nova senten¸ca (senten¸ca de teste). Para fazer isso, ´e necess´ario obter a ´arvore constituinte correspondente a essa nova senten¸ca. Na Figura 4.6, ´e ilustrada uma ´arvore constituinte que corresponde a uma senten¸ca de teste.

S1 S VP VP PP NP NN treatment JJ PROTEIN2 VBG following VBN increased ADVP RB slightly VBD were NP PP NP NNP PROTEIN1 IN of NP NNS Levels

Figura 4.6: ´Arvore constituinte que corresponde a uma senten¸ca de teste.

Com as informa¸c˜oes dessa ´arvore constituinte, os atributos da rede bayesiana, B, s˜ao instanciados com os valores correspondentes. Por exemplo, como a vari´avel aleat´oria V P est´a presente na ´arvore constituinte da senten¸ca de teste, essa vari´avel ´e instanciada com V P = 1. Em geral, “1” indica a presen¸ca de um POS tag e “0” indica a ausˆencia do mesmo. A Figura 4.7 ilustra a instancia¸c˜ao das vari´aveis aleat´orias da rede bayesiana B. Todas as vari´aveis s˜ao instanciadas, com exce¸c˜ao do n´o CLASS. As vari´aveis instanciadas s˜ao chamadas de vari´aveis observadas.

O valor do n´o CLASS ´e estimado usando a probabilidade conjunta descrita na Equa¸c˜ao (3.4). Essa estima¸c˜ao ´e redefinida na Equa¸c˜ao (4.1):

ˆ

y = argCmax {P (C = 0 | B, D, T ), P (C = 1 | B, D, T )} , (4.1)

onde C ´e o n´o CLASS, ˆy ´e o valor do n´o CLASS, B ´e a rede bayesiana constru´ıda pelo m´etodo PT-BN, D ´e o conjunto de ´arvores constituintes de treinamento e T ´e a ´arvore constituinte de uma senten¸ca de teste.

58

Cap´ıtulo 4. Constru¸c˜ao Autom´atica de Redes Bayesianas baseada em ´Arvores Constituintes

S1=1 FRAG=0 NP=1 S=1 PP=1 CD=0 NNS=1 NNP=1 PRP=1 VBG=1 IN=1 VP=1 ADVP=1 VBP=0 RB=1 CLASS

Figura 4.7: Classifica¸c˜ao de uma senten¸ca de teste usando a rede bayesiana constru´ıda pelo m´etodo PT-BN. Os n´os em cor cinza representam vari´aveis aleat´orias observadas. Quando o valor de uma vari´avel ´e “1”, indica a presen¸ca desse POS tag na senten¸ca de teste. Caso contr´ario, indica a ausˆencia de tal POS tag. O n´o CLASS ´e a ´unica vari´avel oculta, cujo valor deve ser estimado usando a probabilidade conjunta da rede bayesiana.

4.7

Considera¸c˜oes Finais

Neste cap´ıtulo foi descrito o m´etodo PT-BN, detalhando as fases para criar um modelo de rede bayesiana a partir de ´arvores constituintes. Dado que essas ´arvores constituintes contˆem implicitamente uma gram´atica, os POS tags dessas s˜ao modelados como vari´aveis aleat´orias. As vari´aveis aleat´orias s˜ao ligadas entre elas, formando um grafo, de acordo com informa¸c˜ao das ´arvores constituintes.

Por´em, na maioria dos casos, o grafo ´e ac´ıclico. Desse modo, ´e proposto um algoritmo de remo¸c˜ao de arestas com v´arias configura¸c˜oes para obter um grafo ac´ıclico dirigido. Nesse sentido, o m´etodo inicia detectando arestas conflitivas. Uma vez que os ciclos s˜ao removidos da estrutura grafo, ´e adicionado um n´o classe C. Para realizar tal adi¸c˜ao, ´e proposto um algoritmo com complexidade linear em termos do n´umero de n´os. Ap´os isso, ´e empregado o c´alculo de parˆametros de um modelo de rede bayesiana, para o qual foram usadas duas estima¸c˜oes da teoria de aprendizado de parˆametros: MLE e Bayes. Al´em disso, o m´etodo apresenta um passo adicional para reduzir o n´umero m´aximo de n´os pais para cada n´o da rede bayesiana. O objetivo de tal redu¸c˜ao ´e evitar o overfitting da rede. Posteriormente, uma vez a rede bayesiana ´e constru´ıda, essa ´e usada para classificar novas senten¸cas de texto. Para fazer isso, ´e usada a estima¸c˜ao de probabilidade conjunta tanto para o caso que exista quanto para o caso que n˜ao exista intera¸c˜ao. Finalmente, o r´otulo de uma nova senten¸ca ´e a classe que corresponde `a maior probabilidade conjunta.

Cap´ıtulo

5

Resultados

5.1

Considera¸c˜oes Iniciais

O

m´etodo proposto nesta disserta¸c˜ao foi avaliado em cinco conjuntos ou corpora padr˜oes de IPPs: AImed, BioInfer, IEPA, HPRD50 e LLL (ver Subse¸c˜ao 2.5.1). A partir das senten¸cas de tais corpora, foram obtidas ´arvores constituintes por meio de um parser do estado da arte, descrito a seguir. Essas ´arvores foram usadas diretamente na constru¸c˜ao dos modelos de redes bayesianas. Tamb´em, usando o crit´erio de pr´e-processamento de ´arvores constituintes proposto em (Choi e Myaeng, 2010), essas ´arvores foram podadas, a fim de obter uma vers˜ao menor da ´arvore que permita melhores resultados.

Considerando isso, a avalia¸c˜ao do m´etodo proposto nesta disserta¸c˜ao, relacionado com a constru¸c˜ao autom´atica de redes bayesianas usando ´arvores constituintes na extra¸c˜ao de IPPs ´e apresentada. Em tal avalia¸c˜ao, s˜ao levados em conta dois pontos. No primeiro ponto, comparam-se os diversos modelos de redes bayesianas constru´ıdos por meio do m´e- todo PT-BN, i.e compara-se o uso das m´etricas de pontua¸c˜ao para a sele¸c˜ao de estrutura de cada modelo de rede e o uso dos m´etodos MLE e Bayes para o c´alculo de parˆametros do mesmo modelo. No segundo ponto, os modelos constru´ıdos pelo m´etodo PT-BN s˜ao comparados com outros classificadores do estado da arte na extra¸c˜ao de IPPs.

Na pr´oxima se¸c˜ao ´e detalhado o pr´e-processamento para obter as ´arvores constituintes a partir de senten¸cas e a poda de tais ´arvores. Em seguida, descreve-se a configura¸c˜ao dos experimentos e, posteriormente, s˜ao apresentados os experimentos usando o m´etodo

60 Cap´ıtulo 5. Resultados PT-BN na extra¸c˜ao de IPPs a partir dos cinco corpora, tamb´em como uma compara¸c˜ao com os m´etodos do estado da arte.