• No results found

Communication and Information Sharing

6 Case Study Analysis, Findings

6.1 Communication and Information Sharing

As heur´ısticas de inclus˜ao tˆem por objetivo detectar SNs impl´ıcitos. De um ponto de vista lingu´ıstico, essas regras s˜ao as mais sofisticadas dentre as propostas, pois atrav´es delas considera- se SNs que n˜ao aparecem no texto, mas podem ser inferidos pela anota¸c˜ao lingu´ıstica. As heur´ısticas de inclus˜ao s˜ao:

• remo¸c˜ao sucessiva de adjetivos; • uso de predicado m´ultiplo; e • conjun¸c˜ao de adjetivos.

O efeito pr´atico das heur´ısticas de inclus˜ao ´e o aumento no n´umero total de SNs. Por exemplo, os 133.250 SNs extra´ıdos do corpus de Pediatria, que n˜ao foram descartados ap´os a aplica¸c˜ao das heur´ısticas de descarte, d˜ao origem a 46.617 SNs impl´ıcitos. Dessa forma, as heur´ısticas de inclus˜ao s˜ao respons´aveis por adicionar um n´umero menor do que os 55.896 SNs que foram removidos pelas heur´ısticas de descarte.

3.3.3.1 I1 - Regra de Inclus˜ao 1 – Detec¸c˜ao de SNs Impl´ıcitos por Remo¸c˜ao Su- cessiva de Adjetivos

A primeira heur´ıstica de inclus˜ao est´a baseada na detec¸c˜ao de SNs contidos em SNs maiores pela remo¸c˜ao sucessiva de adjetivos. Por exemplo, a frase “Estudos realizados mostram o perigo de doen¸cas virais hemorr´agicas.” (Figura 3.4), mostra um caso em que o processo b´asico de extra¸c˜ao detectaria apenas os seguintes SNs: “Estudos realizados”; “perigo de doen¸cas virais hemorr´agicas”; e “doen¸cas virais hemorr´agicas”.

Figura 3.4: Anota¸c˜ao feita para a frase: “Estudos realizados mostram o perigo de doen¸cas virais hemorr´agicas.”.

A proposta dessa heur´ıstica consiste em gerar termos adicionais pela remo¸c˜ao dos adjetivos (ou verbos no partic´ıpio passado) ao fim de cada termo. Dessa maneira, a Tabela 3.4 apresenta os termos que seriam extra´ıdos da frase exemplificada na Figura 3.4.

3.3. HEUR´ISTICAS PROPOSTAS 45

Tabela 3.4: Termos extra´ıdos por remo¸c˜ao sucessiva de adjetivos ou verbos no partic´ıpio passado.

Termo Extra´ıdo Termo Completo classe gramatical

(removido em negrito) do removido

1 Estudos realizados – –

2 Estudos Estudos realizados partic´ıpio passado

3 perigo de doen¸cas virais hemorr´agicas – –

4 perigo de doen¸cas virais o perigo de doen¸cas virais hemorr´agicas adjetivo

5 perigo de doen¸cas o perigo de doen¸cas virais adjetivo

6 perigo o perigo de doen¸cas sintagma preposicional

7 doen¸cas virais hemorr´agicas – –

8 doen¸cas virais doen¸cas virais hemorr´agicas adjetivo

9 doen¸cas doen¸cas virais adjetivo

No corpus de Pediatria 40.156 SNs terminam com pelo menos um adjetivo. A aplica¸c˜ao da heur´ıstica I1 a esses SNs resultou na inclus˜ao de 44.020 novos SNs, ou seja, essa heur´ıstica ´e respons´avel por quase todos os 46.617 SNs inclu´ıdos pelas heur´ısticas desse terceiro grupo. 3.3.3.2 I2 - Regra de Inclus˜ao 2 – Detec¸c˜ao de SNs Replicados pelo Uso de Pre-

dicado M´ultiplo

Na l´ıngua portuguesa ´e comum encontrar o uso de predicados com mais de um verbo. Nesses casos, a senten¸ca representa m´ultiplas frases com o mesmo sujeito e objeto, cada uma delas utilizando um dos verbos do predicado. A segunda heur´ıstica de inclus˜ao atua nesse tipo de situa¸c˜ao, considerando como se as frases com predicado m´ultiplo, fossem desmembradas em diversas frases com um ´unico verbo.

Dessa forma, a regra I2 n˜ao cria SNs diferentes dos originalmente encontrados, pois ela somente replica ocorrˆencias de SNs, que s˜ao sujeito ou objeto de uma senten¸ca que possui predicado com mais de um verbo. Por exemplo, a frase “Pacientes idosos compram e tomam rem´edios mais caros.”, ilustrada na Figura 3.5, mostra esse tipo de situa¸c˜ao.

Percebe-se, pela atribui¸c˜ao de etiquetas feita pelo parser, assim como pelo pr´oprio sentido da frase descrita na Figura 3.5, que ela poderia ser reescrita por duas frases iguais em tudo exceto pelo predicado:

“Pacientes idosos compram rem´edios mais caros.” “Pacientes idosos tomam rem´edios mais caros.”

Caso essa frase seja desdobrada em duas, os SNs relacionados ao predicado duplo ser˜ao computados com duas ocorrˆencias cada. Nesse sentido, a regra I2 prop˜oe que SNs que estejam relacionados com predicados m´ultiplos sejam computados tantas vezes quantos forem os verbos do predicado. A aplica¸c˜ao da regra I2 sobre a frase da Figura 3.5 faz com que os SNs “Pacientes idosos” (sujeito) e “rem´edios mais caros” (objeto) sejam considerados duas vezes cada um, ou seja, como se a extra¸c˜ao fosse feita sobre as frases desmembradas.

No corpus de Pediatria foram encontradas 3.413 frases com predicado m´ultiplo que deram origem a 3.472 novas ocorrˆencias de SNs. Cabe salientar que os predicados m´ultiplos podem ocorrer entre dois verbos, ou ainda em uma lista de trˆes ou mais verbos separados por v´ırgulas. 3.3.3.3 I3 - Regra de Inclus˜ao 3 – Detec¸c˜ao de SNs impl´ıcitos por Conjun¸c˜ao de

Adjetivos

A ´ultima heur´ıstica de inclus˜ao tamb´em ´e baseada na detec¸c˜ao de estruturas gramaticais m´ultiplas com o uso de conjun¸c˜oes, mas ao contr´ario de regra I2, a regra I3 detecta SNs impl´ıcitos quando um mesmo substantivo ´e qualificado por dois ou mais adjetivos. Por exem- plo, a frase “Os pacientes idosos ou obesos possuem maior risco de diabetes.”, ilustrada na Figura 3.6, mostra um caso em que o parser identifica o primeiro SN corretamente como “Os pacientes idosos”, por´em fica impl´ıcito, nessa frase, tamb´em o SN “Os pacientes obesos”.

Figura 3.6: Anota¸c˜ao feita para a frase: “Os pacientes idosos ou obesos possuem maior risco de diabetes.”.

A Tabela 3.5 apresenta alguns exemplos de termos impl´ıcitos criados. Observando a primeira e a segunda frase dessa tabela, percebe-se que a heur´ıstica I3 pode ser empregada sem riscos quando a conjun¸c˜ao ´e alternativa (“ou”), por´em, quando a conjun¸c˜ao aditiva “e” ´e empregada, a semˆantica da frase se presta a diferentes interpreta¸c˜oes. Enquanto que, da primeira frase, se compreende que basta a uma pessoa ser “esperta” ou ser “s´abia” para prever dificuldades, a segunda frase sugere que somente a pessoa que for ao mesmo tempo “esperta e s´abia” poder´a

3.4. AVALIAC¸ ˜AO NUM ´ERICA DAS HEUR´ISTICAS PROPOSTAS 47 prever dificuldades. No entanto, essa duplicidade de interpreta¸c˜ao n˜ao invalida a existˆencia, enquanto termos portadores de informa¸c˜ao, dos SNs “pessoas espertas” e “pessoas s´abias”.

Tabela 3.5: Frases com termos impl´ıcitos e sua detec¸c˜ao.

Frase Exemplo

SN impl´ıcito (SN expl´ıcito em negrito)

1 As pessoas espertasou s´abias podem prever dificuldades. pessoas s´abias

2 As pessoas espertase s´abias podem prever dificuldades. pessoas s´abias

3 O aleitamento materno ´e vital para rec´em-nascidos normaise prematuros. rec´em-nascidos prematuros

4 O defeito pode aparecer na parede abdominal anterior ou tor´axica posterior. a parede tor´axica posterior

As frases 3 e 4 mostram que ´e necess´ario substituir o mesmo n´umero de adjetivos do SN expl´ıcito, quantos forem os adjetivos encontrados ap´os a conjun¸c˜ao. Por exemplo, na frase 4 n˜ao seria correto gerar o termo impl´ıcito “A parede abdominal tor´axica posterior”, pois os adjetivos que seguem a conjun¸c˜ao “ou” correspondem a duas palavras (“tor´axica posterior”) e portanto devem substituir em igual medida os adjetivos do termo expl´ıcito (“abdominal anterior”).

A aplica¸c˜ao da regra I3 sobre os termos originalmente extra´ıdos do corpus de Pediatria resultou na inclus˜ao de 861 novos SNs.