Arbeid, velferd og språk - Handlingsplan for integrering og inkludering avinnvandrerbefolkninge

Além do uso dificultoso feito pelo jornalista, há ainda o viés dos seres humanos que desenvolvem os aparatos do universo vasto e crescente das utilidades que vão desde softwares para transcrever entrevistas automaticamente, notícias que são geradas automaticamente e scripts para fazer classificação de informações. Quando lidados com as nebulosidades e problemas para uma melhor adoção da tecnologia, não apenas percebemos a incongruência dos jornalistas com as ciências exatas, mas também algumas barreiras das ciências exatas com os pormenores da própria linguagem e do propósito ético do jornalismo propriamente dito.

A aprendizagem de máquina já implementa projetos de vanguarda no uso da técnica na apuração, mineração de dados, simulações da linguagem, utilização de robótica e demais ferramentas de inteligência artificial. Mas segundo Ben Zhao, apesar das utilizações positivas, a relação entre inteligência artificial e jornalismo também tem seu lado perigoso. Já existem tecnologias que geram automaticamente opiniões como se fossem comentários humanos, com a possibilidade de promover depoimentos que podem ser facilmente confundidos como fontes verídicas (Yao et alli, 2017). Opiniões que podem estar a servir como fundamentação específica de alguma fonte, como esclarece Evgeny Morozov:

No campo econômico, vemos uma riqueza imensa ser acumulada por apenas um punhado de investidores que se mostraram inteligentes e rápidos o bastante para investir no setor da tecnologia. A mecânica dessa indústria, contudo, não é necessariamente favorável à recuperação do crescimento econômico global – a concentração de dados e, por extensão, dos serviços de IA nas mãos de apenas umas poucas emrpesas pode trazer com que se tornem guardiões ( e guardiões potencialmente em busca de lucros) da nova economia digital. (Morozov, 2008, n.p)

Outra possibilidade negativa são os chamados deepfakes, vídeos que substituem o rosto e a fala de pessoas reais com material manipulado. Como detalham Yao et alli (2017), são procedimentos ainda um pouco trabalhosos, mas nada impossíveis, que podem ser executados por meio da utilização de computadores robustos, aplicativos disponíveis abertamente ao público pela divisão de Inteligência Artificial do Google Coorporation, vídeos originais como base e manipulação de imagens. Dada a evolução da tecnologia por meio das redes neurais para identificar padrões de voz e movimento, esse tipo de conteúdo falso começa a desenvolver cada vez mais possibilidades convincentes na tarefa de enganar as pessoas (Yao et alli, 2017). Isso em conteúdo de Facebook, Twitter, blogs, sites e todo o tipo de conteúdo de texto, áudio e vídeo.

Os últimos anos trouxeram um furor exacerbado sobre o que as máquinas podem oferecer, com a automação a ser vendida como a solução para todos os problemas, ou vice-versa. De fato, as evoluções são gigantescas, mas no meio disso são empurradas muitas soluções que são vendidas como inteligência artificial, mas que de fato são truques e farsas. A primeira limitação vem da capacidade das máquinas, já que modelos desenvolvidos em cima da leitura de dados e de inteligência artificial comumente exigem capacidades técnicas que apenas computadores especiais possuem. Ainda assim, a gestão e obtenção de uma gama grande de dados é fundamental para a possibilidade de gerar projetos interessantes, então essa atuação com a informação também é primordial.

Além uma correlação com a capacidade computacional e de equipamentos disponíveis, devemos considerar as limitações sobre-humanas. Judas Pearl, um dos proeminentes cientistas da inferência causal, chama a atenção para a comunidade científica faça as máquinas entenderem a pergunta do porquê das coisas, pois o aprendizado de máquina possui uma série de limitações e uma delas é a contextualização (Pearl e Mackenzie, 2018). Aindas egundo ele, máquinas não conseguem distinguir o que os humanos também não conseguem, então estes limites sempre estarão presentes de alguma forma. Estes desvios, conhecidos como Erros de Bayes, definem um importante parâmetro de desconfiança quando companhias dizem que conseguem gerar um resultado muito além que seres humanos conseguem. Outro ponto interessante de cuidado para a utilização da aprendizagem de máquina é de que modelos tradicionais não captam bem Causa e Efeito, que é uma variante importante para a compreensão dos dados.

Como vemos nas redes sociais, máquinas já são ótimas para identificar perguntas de diagnóstico, como quais das imagens representam gatos e quais representam humanos. No entanto, não possuem a mesma facilidade na compreensão de questões de intervenções, como a indagação sobre o que haveria sido da humanidade se Hitler tivesse vencido a Segunda Guerra. Pessoas conseguem refletir sobre essas questões, mas máquinas ainda não. Como esclarece Pearl:

Most relevant for us is the question of what comes next. How do we extract meaning from all these numbers, bits, and pixels? The data may be immerse, but the questions we ask are simple. Is there a gene that causes lung cancer? What kind of solar systems are likely to harbor Earth-like planets? What factors are causing the population os our favorite fish to decrease, and what can we do about it? In certain cilcles there is an almost religious faith that we can find the answers to these questions in the data itself, if only we are sufficiently clever at data mining. (…) The questions I have just asked are all causal, and causal questions can never be answerd from data alone. They require us to formulate a model or process that generates the data, os at least some aspects of that process. Anytime you see a paper or a study that analyzes the data in a model-free way, you can be cartain that the output of the study will merely summarize, and perhaps transform, but not interpret the data. (Pearl e Mackenzie, 2018, p. 351).

As máquinas ainda não conseguem responder às questões do porquê, assim, entender causa e efeito pode aproximar máquinas e as interações de humanos, sejam jornalistas ou mesmo pesquisadores em trabalho conjunto. Na produção da informação, dentro do já descrito lead jornalístico, as dimensões da informação quem?, onde?, quando?, como?, o quê?, por quê?; a dimensão do porquê é dada pelos contextos. Seguramente, é muito arriscado dizer que variável é a causa de outra variável e os pesquisadores evitam ao

máximo fazer isso. Entender a causa está no oposto de uma ligação dos dados propriamente dita, em outras palavras “Causal inference permits us to screen off the irrelevant characteristics and to recruit these individuals from diverse studies, while big data allows us to gather enough information about them. ” (Pearl e Mackenzie, 2018, p. 352).

É fácil propor correlações entre variáveis, e até simplesmente alinhar referências entre os valores da mesma variável ao longo de um tempo determinado. Contudo, fazer a inferência causal, ou seja, dizer qual variável tem influência direta sobre outra variável, realizada de forma causal, é uma tarefa difícil e arriscada.

In document Handlingsplan for integrering og inkludering avinnvandrerbefolkningen – styrket innsats 2008 Mål for inkludering (sider 30-34)