Bestilling og produksjon av elektriske anleggsmaskiner

4. Den utslippsfrie byggeplassen

4.2 Den innovative byggeplassen

4.2.1 Bestilling og produksjon av elektriske anleggsmaskiner

Os intérpretes virtuais (avatares) sinalizadores são modelos de personagens que articulam em LS. São agentes conversacionais com faces animadas falantes, expressões faciais, síntese de fala com sincronização labial, gráficos tridimensionais com movimentos de corpo complexos (BALDASSARI; CEREZO; SERON, 200825

citado por BRITO, 2012).

As legendas baseadas em avatares têm como características: humanoide realísticos (representação fotorrealista de uma figura humana) ou cartoon (representação visual mais sintética); 2D ou 3D (permite melhor compreensão dos sinais), renderização no contexto da web, do lado servidor ou do lado cliente, gerando vídeos pré-gravados ou sob demanda e tecnologia gráfica utilizada (FAJARDO; VIGO; SALMERÓN, 2009). O resultado da sinalização pelo avatar pode ser pela conversão de texto ou reconhecimento de voz e respectiva tradução para geração de LS. A tradução pode ser automática ou através de técnicas manuais, buscando uma melhor qualidade da comunicação em LS e, consequentemente, compreensão pelos surdos.

A síntese dos sinais gera movimentos equivalentes aos de um intérprete humano, a partir de certos parâmetros que devem ser seguidos, para que a sinalização cumpra seu objetivo de comunicação. Estes parâmetros envolvem: meios utilizados para armazenamento do material produzido, a forma de modelagem dos avatares e elementos que favoreçam o realismo e inteligibilidade da mensagem apresentada (BRITO,2012). Em relação à aparência dos avatares, seguem as recomendações de um intérprete humano como cor de roupa, iluminação do estúdio, codificação do vídeo. Além disso, a síntese dos sinais deve evitar movimentos robotizados

25 _{BALDASSARI, S.; CEREZO, E.; SERON, F. J. Maxine: A platform for embodied animated agents.}

e falta de emoção na entonação dos sinais. Os avatares, cujos sinais seguiram a forma não segmentada, apresentaram formas mais suaves na sinalização e foram melhor aceitos que os altamente segmentados (ADAMO-VILLANI et al., 200926 _{citado por} _BRITO_, ₂₀₁₂_).

“Diante da grande demanda de material audiovisual a ser traduzido e legendado, e a reduzida disponibilidade de interpretes, os avatares demonstram ser uma alternativa viável para apoiar a produção automática de conteúdo em LS“ (BRITO, 2012, p. 236). Contudo, fatores associados ao baixo realismo e tradução automática (palavras por palavras) por mecanismos de tradução podem reduzir sua confiabilidade. Apesar desses fatores, a produção de legendas com vídeo de LS por meio de avatares demonstra-se promissora, devido às suas vantagens: (1) Criação de conteúdo em LS pode ser realizada por uma única pessoa utilizando um computador, sem a necessidade de equipamentos especiais para captura e processamento de vídeos; (2) Conteúdo em LS pode ser criado mais facilmente, por pessoas não necessariamente treinadas e com fluência em LS; (3) Possibilidade de realizar a geração de conteúdo em LS em tempo real; (4) Possibilidade de edição de conteúdo a qualquer momento, sem a necessidade de regravar a sequência de sinalização inteira; (5) Flexibilização nas modalidades de entrega da legenda (automática/manual, em tempo real/pré-gravada, troca de intérprete); (6) Dicionário de sinais pode ser armazenado do lado do servidor, não sendo necessário espaço em disco como no caso de vídeos; (7) Ganhos de escala na produção de conteúdo a partir de sistemas de tradução automática; (8) Transmissão do conteúdo mais rápida, pois os conteúdos transcritos podem ser armazenado em arquivos de texto, menores e mais rápidos de serem transmitidos em comparação aos arquivos de vídeos; (9) Possibilidade de oferecer ao usuário controle adicional sobre o material transmitido (alteração do ponto de vista durante a reprodução para que o sinal seja mais bem visualizado), o que não é possível se fazer em vídeo (BRITO, 2012;AMARAL,

2012).

A legendagem em LS por meio de agentes virtuais se apresenta, portanto, como uma alternativa ao uso de vídeos de intérpretes reais. Contudo, para que a tradução virtual em LS atenda ao objetivo de comunicação, deve ser realista e se aproximar das características da LS. É necessário então um estudo aprofundado da estrutura linguística dos sinais e sua aplicação na tradução para recriar, de forma mais próxima da real, todo processo comunicativo da LS. “Não basta manter um dicionário de sinais e reproduzi-los em sequência“ (AMARAL, 2012, p. 5). Logo, é importante que a qualidade comunicativa do mecanismo de tradução, por meio de avatares, seja avaliada por profissionais capacitados em LS, antes que ele seja utilizado como alternativa de acessibilidade.

Algumas traduções são realizadas a partir da análise da estrutura frasal, enquantos outros mecanismos realizam tradução por palavras, não considerado os aspectos gramaticais e estruturas das frases (BRITO, 2012). A tradução direta da língua escrita para LS, ignorando

26 _{ADAMO-VILLANI, N. et al. Effects of character geometric model on perception of sign language animation.}

2.7. Acessibilidade: Tradução e Interpretação 97

os aspectos linguísticos específicos da LS, pode gerar conteúdos incompreensíveis pelos surdos. Esta avaliação deve considerar a qualidade e sincronia da animação gerada, de forma a permitir a compreensão do conteúdo.

A técnica para síntese de sinais pode ser concatenativa ou articulatória. Estas duas técnicas geram dados de movimentos para um avatar articulado. Na síntese concatenativa, os movimentos pré-gravados, repartidos em pequenos segmentos, são recombinados para criar os sinais.

A síntese concatenativa consiste na junção dos dados de animação armazena- dos em uma base de dados sobre sinais. Estes dados utilizam determinados padrões e possibilitam o reuso de dados provenientes da captura de movi- mentos de um intérprete ou então de dados gerados manualmente. Os sinais cadastrados são associados à palavras da língua oral, de modo que um texto de entrada é associado a um dicionário de sinais ou glossário, e caso haja um registro no dicionário correspondente ao fragmento de texto, a animação do sinal correspondente é apresentada. Caso o sinal não esteja cadastrado no dicionário, o texto é fragmentado e apresentado pelo agente 3D utilizando a datilologia (BRITO,2012, p. 151).

A síntese articulatória utiliza os componentes fonológicos dos sinais representados num sistema de escrita (oral ou LS). Estes componentes correspondem ao processo de articulação da fala humana e são utilizados como parâmetros para animação dos avatares. Sínteses articulatórias são mais adequadas para novas transições entre sinais em tempo de execução. As síntese concatenativas já são mais adequadas para uso de um sistema de escrita oral para gerar animações em um sistema visual-espacial.

In document Å bygge mot strømmen. En sosioteknisk studie av utslippsfrie bygge- og anleggsplasser. (sider 40-45)