7 Demonstration - SAR-based End Products
7.1 SAR mosaics
7.1.2 ENVISAT ASAR alternate polarization (ASAR-APS) 2010-2011
Para o desenvolvimento deste trabalho, nos orientamos pela metodologia proposta por Dias-da-Silva (1996). Segundo o autor, para que o PLN avance, há a necessidade de minimizar o divórcio entre os “cientistas da linguagem” e os “engenheiros da linguagem,” devendo haver um trabalho, na realidade, colaborativo entre os profissionais voltados à Computação e aqueles voltados à Linguística, como observamos a seguir:
Os cientistas da computação sabem propor e gerenciar projetos de software. Eles dispõem de equipamentos e ferramentas de programação de vanguarda, e as linguagens simbólicas são seu material de trabalho. Por outro lado, entretanto, eles frequentemente não dominam os conhecimentos linguísticos. (SANDERS e SANDERS, 1989, p. 30 apud DIAS-DA-SILVA, 1996, p. 84).
O trabalho de Dias-da-Silva (1996) foi responsável por direcionar as metodologias de PLN ao ter proposto uma forma de organizar o desenvolvimento de suas aplicações. Sendo assim, foi proposta a metodologia trifásica, a partir da argumentação de que os projetos de desenvolvimento de sistemas de PLN específicos precisam enfrentar os níveis de processamento gramatical e pragmático-discursivo em três domínios: o Linguístico, o Representacional (Linguístico-computacional) e o Implementacional (Computacional).
Segundo Dias-da-Silva (1996), o PLN se compõe de conhecimentos originários de áreas diversas. Assim, para o autor, faz-se necessária a criação de uma
metodologia que alcance, pelo menos, todos os campos do saber exibidos na Figura 8.
Figura 8 - Recursos teóricos e metodológicos de que o estudo em PLN dispõe
Fonte: Dias-da-Silva (1996, p. 83).
Segundo o autor, há uma multidisciplinaridade dentro do campo de estudos de PLN que se materializa na criação de um simulacro computacional do conhecimento gramatical dos falantes de uma língua nas suas situações concretas de fala:
(...) o campo de estudos sobre o PLN não poderia deixar de ser um domínio de pesquisas privilegiado, amplo e fecundo, uma vez que a construção do corpo de conhecimentos necessários para a implementação de sistemas computacionais com esse grau de sofisticação necessariamente exige a seleção, a organização, a representação e a codificação de uma variedade de informações na complexa tarefa de criar um simulacro computacional da “competência” e do “desempenho” lingüísticos. (DIAS-DA-SILVA, 1996, p. 83).
Linguística como objeto para a Computação, espera-se o desenvolvimento de sistemas computacionais capazes de processar objetos de natureza linguística. Para Dias-da-Silva (1996, p. 13),
“investigar o PLN é, antes de tudo, aventurar-se em participar de um empreendimento fascinante e desafiador que, talvez um dia, venha a transformar máquinas em nossos interlocutores e parceiros cibernéticos, capazes de nos auxiliar no planejamento das mais variadas tarefas e, até mesmo, na resolução dos problemas mais recalcitrantes”.
Esse pensamento audacioso está compreendido em um nível macroestrutural, cujas máquinas utilizariam as línguas naturais para todo e qualquer tipo de comunicação com os seres humanos. Podemos estar um pouco longe disso atualmente, mas, pelo menos, a iniciativa de trilhar esse rumo muitas das vezes nos ajuda a descrever e desenvolver sistemas em uma escala microestrutural como parsers, taggers, tradutores etc., que podem, num futuro, compor sistemas “maiores” de reconhecimento geral de fala.
A grande meta prevista para as pesquisas dessa natureza é indiscutivelmente ousada: projetar e implementar sistemas computacionais avançados em que a comunicação entre o homem e o computador possa realizar-se por meio de línguas naturais, e não por meio de instruções e comandos codificados numa linguagem de programação artificialmente construída por programadores (DIAS- DA-SILVA, 1996, p. 13).
Para Halvorsen (apud Dias-da-Silva, 1996, p. 89), o estudo do PLN tem procurado a construção de:
uma ponte entre a teoria da competência e o tipo de desempenho lingüístico atribuído às máquinas, transformando a teoria lingüística em algoritmos que, ao mesmo tempo, simulam o comportamento lingüístico e obedecem às restrições e generalizações previstas pela teoria lingüística e pelas gramáticas [das línguas particulares].
Como podemos perceber a partir da citação acima, o conhecimento da teoria linguística e suas descrições devem ser transformados em algoritmos que simulam o comportamento linguístico das línguas naturais. Desta forma, como síntese do pensamento de Dias-da-Silva (1996), e guia norteador deste trabalho, são apresentadas na Figura 9 as fases necessárias para desenvolvimento de qualquer sistema em PLN.
Figura 9 - Fases de construção de um sistema de PLN
Fonte: Dias-da-Silva et al. (2007, p.14)
Podemos, na Figura 10, a seguir, observar com maior detalhamento o comportamento dos domínios e sua forma de lidar com os seus elementos diversos.
Figura 10 - Organização das fases que compõem a metodologia
Fonte: Dias-da-Silva (1996, p. 89).
No topo da Figura 10 temos os domínios, problemas e recursos, com as suas respectivas tarefas. No domínio linguístico, o principal objetivo é produzir descrições de
língua, explicitando o conhecimento e uso linguístico, incluindo seus fenômenos, suas regras e seus conceitos, segundo os recursos de competência e desempenho. Para o domínio representacional, o objetivo é representar os dados descritos no domínio anterior, o linguístico. Para essa representação, devem ser criados sistemas formais processáveis por máquina. No domínio implementacional, tem-se como objetivo transpor as representações geradas no domínio representacional em linguagens de programação e plataformas responsáveis pela implementação da ideia inicial, em um produto físico-computacional ou ferramenta.
Para que essa metodologia funcione, há a necessidade de seus domínios serem seguidos na ordem expressa pela figura acima, mas é claro que cada domínio, problema ou recurso possui certa proximidade de trabalho, expressa pelas setas para cima e para baixo.