mentos
Na ´ultima etapa do m ´etodo, Etapa 4: Construc¸ ˜ao de uma Rede Sem ˆantica de Conhecimentos, uma rede sem ˆantica ´e formada unindo a maior quantidade poss´ıvel de relac¸ ˜oes para formar uma rede de conhecimentos.
A rede ´e uma estrutura de grafo. Possui informac¸ ˜oes tanto nos n ´os quanto nas arestas. Nos n ´os s ˜ao armazenadas informac¸ ˜oes como termo, se h ´a e qual a tip word increase/decrease associada, o n ´umero e o nome do artigo a qual foi extra´ıda. Os n ´os poss´ıveis s ˜ao n ´os do tipo tip word increase/de-
crease + termo ou apenas termo. Resumidamente, seguem os mesmo conceitos apresentados na
Sec¸ ˜ao 4.2, no item Relac¸ ˜ao Sem ˆantica.
Na Figura 29 s ˜ao apresentados os tipos de n ´os poss´ıveis na rede de conhecimentos.
Figura 29: Tipos de n ´os poss´ıveis na rede de conhecimento.
A aresta liga um n ´o a outro, indicando que um termo possui relac¸ ˜ao com outro. Na aresta s ˜ao armazenadas informac¸ ˜oes como tip words association, negation e possibility que fazem parte daquela relac¸ ˜ao.
79
Como exemplo, a partir dos artigos do Corpus de trabalho, foram extra´ıdas algumas relac¸ ˜oes de causalidade de quatro artigos diferentes. As relac¸ ˜oes podem ser verificadas a seguir e os artigos, simbolicamente nomeados de 1 a 4, indicam a origem de onde os relacionamentos foram extra´ıdos:
artigo 1: cause-effect(adhesion molecule, associated with , pulmonary hypertension) artigo 1: cause-effect(adhesion molecule, associated with , organ dysfunction) artigo 1: cause-effect(adhesion molecule, associated with , mortality)
artigo 2: cause-effect(sickle cell anemia, associated , pulmonary hypertension) artigo 2: cause-effect(sickle cell anemia, associated , organ dysfunction) artigo 3: cause-effect(vascular injury, increase adhesion molecule)
artigo 3: cause-effect(endothelial dysfunction, increase adhesion molecule)
artigo 4: cause-effect(increase adhesion molecule, correlated with severity of , mortality)
Podemos observar que foram extra´ıdas oito relac¸ ˜oes. As relac¸ ˜oes oriundas do artigo 1, possuem apenas um relacionamento de associac¸ ˜ao representado pelo tip word associated with, assim como no artigo 2 que possui apenas um relacionamento de associac¸ ˜ao representado pelo tip word associ-
ated. J ´a no artigo 3, foi encontrada uma relac¸ ˜ao do tipo increase/decrease ligada ao termo adhesion molecule. Por ´ultimo, no artigo 4, encontramos um relacionamento de associac¸ ˜ao, representado pelo tip word correlated with severity of, seguido pelo termo increase.
Podemos verificar tamb ´em, que os termos de cada relacionamento podem se ligar uns aos outros tecendo a rede sem ˆantica de conhecimento. Na Figura 30 ´e poss´ıvel visualizar essa construc¸ ˜ao.
Figura 30: Etapa 4: Construc¸ ˜ao de uma Rede Sem ˆantica de Conhecimentos.
A ideia principal que envolve a construc¸ ˜ao da rede sem ˆantica de conhecimentos ´e que, por meio de relacionamentos parciais como A=> B e B => C, podemos encontrar uma cadeia de relac¸ ˜oes, como A=> B => C e concluir que A => C. Com isso, os especialistas na ´area biom ´edica podem sugerir novas hip ´oteses de tratamentos, por meio de relacionamentos que antes poderiam ser desconhecidos sem uma leitura minuciosa de v ´arios artigos cient´ıficos que envolvem esse conhecimento.
4.7
Considerac¸ ˜oes Finais
Ao longo do Cap´ıtulo 4, M ´etodo Proposto, foi poss´ıvel conhecer o m ´etodo desenvolvido para extrac¸ ˜ao de relacionamentos sem ˆanticos do tipo “causa e efeito” em artigos cient´ıficos do dom´ınio biom ´edico.
Na Sec¸ ˜ao 4.1, Estudo Piloto, foi apresentado o estudo realizado previamente ao exame de qualificac¸ ˜ao, cujo objetivo foi o entendimento mais aprofundado do problema em quest ˜ao e das necessidades que os pesquisadores da ´area biom ´edica possuem quando enfrentam esse tipo de problema.
No estudo, foram lidos alguns artigos da ´area biom ´edica, relacionados `as complicac¸ ˜oes, espec´ıficos da Anemia Falciforme. Foram extra´ıdas manualmente sentenc¸as que continham relac¸ ˜oes de causali- dade e, em seguida, tais relac¸ ˜oes foram associadas entre si formando pequenas redes de conheci- mento.
Na Sec¸ ˜ao 4.2, Definic¸ ˜oes, foram apresentados alguns conceitos necess ´arios para o entendimento do trabalho de pesquisa, tais como: Token, Termo, Tip Word e Relac¸ ˜ao Sem ˆantica. Redefinimos a
representac¸ ˜ao sem ˆantica adotada neste trabalho de pesquisa, apresentando as principais diferenc¸as da representac¸ ˜ao usualmente adotada na literatura.
Na Sec¸ ˜ao 4.3, Recursos, foram apresentados os corpora utilizados tanto no estudo piloto quanto nos testes (apresentados no Cap´ıtulo 5) executados com o m ´etodo proposto. Al ´em disso, destaca-se tamb ´em a utilizac¸ ˜ao de dados oriundos de ontologias da ´area biom ´edica que foram utilizados para a construc¸ ˜ao dos dicion ´arios de termos de dom´ınio.
Na Sec¸ ˜ao 4.4, Anotac¸ ˜ao do Corpus de Trabalho, foi apresentada a forma na qual os textos foram anotados.
Na Sec¸ ˜ao 4.5, Ferramentas, foram apresentadas as ferramentas desenvolvidas durante o trabalho, JPdf2JSON e ARS. Apresentamos tamb ´em os softwares e as bibliotecas utilizadas, como etiquetador
Stanford POS Tagger. Por ´ultimo, foram citados os scripts de testes desenvolvidos para gerac¸ ˜ao dos
resultados.
Na Sec¸ ˜ao(4.6), Arquitetura do M ´etodo Proposto, foi apresentado o m ´etodo de extrac¸ ˜ao de rela- cionamentos sem ˆanticos de causalidade, composto por 4 etapas principais: 1. Entrada e Preparac¸ ˜ao de Dados, 2. Extrac¸ ˜ao de Termos, 3. Identificac¸ ˜ao de Relacionamentos Sem ˆanticos do tipo “causa e efeito” e 4. Construc¸ ˜ao de uma Rede Sem ˆantica de Conhecimentos.
A seguir s ˜ao apresentados os m ´etodos de validac¸ ˜ao e testes do m ´etodo proposto, bem como os resultados conquistados e a validac¸ ˜ao das hip ´oteses levantadas no in´ıcio dos trabalhos.
Cap´ıtulo 5
VALIDAC¸ ˜AO E
TESTES
Este cap´ıtulo apresenta o processo de validac¸ ˜ao do m ´etodo proposto, al ´em da validac¸ ˜ao das
hip ´oteses.
A validac¸ ˜ao do m ´etodo de extrac¸ ˜ao de relacionamentos sem ˆanticos do tipo “causa e efeito” em artigos cient´ıficos do dom´ınio biom ´edico foi realizada em algumas etapas. Nessas etapas comparamos a utilizac¸ ˜ao do m ´etodo proposto com outros m ´etodos j ´a existentes e aplicados em situac¸ ˜oes semelhan- tes. Al ´em disso, os resultados obtidos pela aplicac¸ ˜ao do m ´etodo proposto foram comparados com os resultados obtidos de forma manual pelos humanos.
As etapas executadas durante a fase de testes est ˜ao divididas entre (1) comparac¸ ˜ao com a anotac¸ ˜ao manual, (2) a implementac¸ ˜ao do algoritmo PolySeach, (3) a implementac¸ ˜ao do algoritmo de Girju e Moldovan (2002), (4) e experimentos utilizando t ´ecnicas de aprendizado de m ´aquina.