• No results found

Hvordan legger ledelsen til rette for læringsprosesser som fremmer PLF?

Desde sempre se sonhou com o que se designa de inteligência artificial, sendo a história publicada por Mary Shelley, em 1818, um desses sonhos, quando descreve a tentativa do Dr. Victor Frankenstein, de criar vida. Hoje, a inteligência artificial (IA) é um campo próspero, com muitas aplicações práticas e tópicos ativos de pesquisa. Busca-se o software inteligente para automatizar o trabalho de rotina, entender a fala ou as imagens, fazer diagnósticos na medicina e apoiar pesquisas científicas básicas (Goodfellow, Bengio e Courville 2017).

Neste momento, as possibilidades que as tecnologias de informação suscitam levam ao ponto de poderem marcar a diferença e tornar-se uma mais valia quando aplicadas à descrição,

47

tendo apenas de perceber o modo como ensinar as máquinas a interpretar a informação e a atribuir as classificações respetivas. A evolução que ocorreu e que leva a que as máquinas pensem como seres humanos é o que designamos por fenómeno da Inteligência Artificial (IA), sustentada pelo Machine Learning (ML) e o Deep Learning (DP).

John McCarthy ao organizar a IA Darthmouth Conference, em 1956, para estabelecer uma nova área para estudar computação e inteligência, definiu-a como “a ciência e a engenharia de fabricação de máquinas inteligentes”.

O ML teve em Arthur Samuel um dos seus pioneiros, o qual nos anos 60 começou a explorar a possibilidade de as máquinas pensarem, tendo ensinado um programa de computador a jogar damas. Nos anos 80 surgem novos avanços, como a primeira forma de colocar em prática os conceitos de inteligência artificial e o DP desenvolveu-se a partir de 2010.

Para Goodfellow, Bengio e Courville (2016), três especialistas amplamente publicados no campo da inteligência artificial, o DL apresenta um crescimento enorme em popularidade e utilidade, em grande parte como resultado de computadores mais poderosos, conjuntos de dados e técnicas maiores para treinar redes mais profundas. Mas, na verdade, o deep learning remonta aos anos 1940, só que foi relativamente impopular por vários anos face à incompreensão de uma máquina que sabe pensar (Goodfellow, Bengio e Courville 2016).

Figura 8 - Diagrama de Venn mostrando como a deep learning é um tipo de aprendizagem de representação, que é, por sua vez, uma espécie de aprendizagem de máquina, que é usado para muitas, mas não todas, abordagens à IA. Cada seção do diagrama de Venn inclui um exemplo de uma tecnologia AI.26

Mas o que é Machine Learning (ML)?

Arthur Samuel (1959) define o machine learning como o “campo de estudo que dá aos

computadores a capacidade de aprender sem serem programados explicitamente”. É o uso de

48

algoritmos para organizar dados, reconhecer padrões e fazer com que computadores possam aprender com esses modelos e gerar insights inteligentes sem necessidade de pré-programação.

O que é Deep Leaning (DL)?

Podemos também usar a mesma definição do deep learning que Arthur Samuel usa para machine learning, pois é também uma forma de aprendizagem da máquina, sendo que deep é um termo técnico. Refere-se ao número de camadas em uma rede neural.

Yoshua Bengio (2017) diz que o DL permite que os computadores aprendam com a experiência e compreendam o mundo em termos de uma hierarquia de conceitos. Como o computador reúne conhecimento da experiência, não é necessário que um operador de computador humano especifique formalmente todo o conhecimento de que o computador precisa. A hierarquia de conceitos permite que o computador aprenda conceitos complicados, construindo-os a partir de conceitos mais simples (Yoshua 2017). Tal é conseguido por meio de algoritmos de alto nível que imitam a rede neural do cérebro humano, utilizando camadas discretas, conexões e direções de propagação de dados. Assim, os dados são submetidos a várias camadas de processamento não lineares que simulam a forma de pensar dos neurônios. A principal aplicação dos algoritmos de deep learning são as tarefas de classificação, em especial, reconhecimento de imagens.

A compreensão sobre o conceito de informação no ambiente computacional significa atribuir uma contextualização aos dados e neste contexto tem sido desenvolvido um conjunto de técnicas e operações, designadas de deep learning, tornando possível a promoção da deteção, da perceção e o reconhecimento automático de objetos (Gracioso, Simionato, Machado e Simões, 2018).

Considerando que as fotografias, objeto de estudo nesta dissertação, têm uma grande quantidade de informação e de semântica associada ao seu conteúdo, será um dos campos privilegiados de exploração do deep learning, principalmente, a descrição e indexação automática de imagens. O deep learning resolve o problema central na aprendizagem de representação, introduzindo representações que são expressas em termos de outras representações mais simples.

O deep learning permite que o computador construa conceitos complexos a partir de conceitos mais simples. A Figura 9 mostra como um sistema de deep learning pode representar o conceito de uma imagem de uma pessoa combinando conceitos mais simples, como cantos e contornos, que por sua vez são definidos em termos de borda (Goodfellow, Bengio e Courville 2016).

49

Figura 9 - Ilustração de um modelo de deep learning model27

Com a Web 2.0 foram desenvolvidas novas plataformas para melhorar a interação e a cooperação. Uma das práticas, que atribui classificações por elementos de destaque na imagem é designada indexação social (tagueamento ou folksonomia), que pode advir de uma indexação profissional ou mesmo criado a partir de linguagem natural com a colaboração dos utilizadores (Gracioso, Simionato, Machado e Simões, 2018).

O Flickr foi a plataforma pioneira no uso da folksonomia como forma de indexação livre e pessoal em substituição dos tradicionais esquemas de representação do conhecimento, como tesauros ou taxionomias, permitindo também o armazenamento e partilha de imagens sem restrições de direitos autorais. Contudo, os problemas do uso de vocabulário descontrolado permanecem entre as preocupações centrais com a integração de folksonomias em meta- informação ou usá-los como índices claros (Benoit III 2018).

Como refere Cordeiro (2018) a nomeação de conceitos e emoções abstratos identificados em documentos já levantaram questões sobre a sua utilidade. É preciso ter em atenção as contrariedades de uso de linguagem não controlada. E porquê ? Porque tal como refere Ribeiro (1996), no acesso aos arquivos, tal linguagem, embora facilite e torne mais expedita a indexação pois não é gasto muito tempo na determinação e escolha dos termos — o que pode ser considerado uma vantagem — gera, no entanto, dificuldades no momento da pesquisa, fazendo então perder muito tempo e aumentando as possibilidades de acesso a documentação não relevante para as questões postas pelos utilizadores.

Como refere Cordeiro (2018) a nomeação de conceitos e emoções abstratos identificados em documentos já levantaram questões sobre a sua utilidade. É preciso ter em atenção as

50

contrariedades de uso de linguagem não controlada. E porquê ? Porque tal como refere Ribeiro (1996), no acesso aos arquivos, tal linguagem, embora facilite e torne mais expedita a indexação pois não é gasto muito tempo na determinação e escolha dos termos — o que pode ser considerado uma vantagem — gera, no entanto, dificuldades no momento da pesquisa, fazendo então perder muito tempo e aumentando as possibilidades de acesso a documentação não relevante para as questões postas pelos utilizadores.

E, no caso das fotografias, como Benson (2010) defende, as suas descrições envolvem um universo de discurso que é tanto interpretativo quanto factual. Olhar para uma fotografia e descrever o que ela significa pode ser tão simples quanto listar os nomes dos elementos reconhecidos numa figura ou tão complexos quanto interpretar simbolismos abstratos representados por esses elementos.

Gracioso, Simionato, Machado e Simões (2018), no seu estudo de verificar se as técnicas de representação e descrição artificiais e automatizadas têm sido consideradas no complexo processo de representação, recuperação, acesso e uso da informação pela CI, dizem que foi possível sistematizar potenciais categorias temáticas já investigadas, sendo elas: a) o aumento da precisão na anotação e classificação de imagens; b) o auxílio no controle da discrepância semântica entre a informação visual e o entendimento humano; c) a extração e combinação automática de diversa informação imagética; d) a capacidade de prover ao sistema uma aprendizagem semântica a partir das suas experiências. Facto que é corroborado por Allen C. Benson (2010), ao esclarecer que a informação contida nas descrições é expressa em linguagem natural; ou seja, a linguagem que os humanos usam para escrever e falar. As descrições de linguagem natural serão o maior inibidor da partilha de informação, impedindo que os atuais modelos de descrição arquivística sejam “significativos” e compartilháveis na Web semântica. Isto acontece porque a informação não está a ser formalizada na linguagem em que a máquina a armazena pelo que o que entende além do que vê é como se fosse uma série de linhas onduladas e assim, a primeira máquina é impedida de partilhar o seu conhecimento com qualquer outra máquina. Exemplo disso é o caso de uma máquina conseguir ler o número “1960” mas não saber que representa uma data ou o que é uma data; a máquina sabe ler uma a sequência de caracteres ASCII.

Tim Berners-Lee fundador da world wide web prevê a próxima geração da Web, Web 3.0, como sendo uma Web semântica, - uma Web onde as máquinas não apenas leem, mas compreendem o que lêem, pelo que os arquivistas terão de repensar o modo a indexação uma vez que a relevância é fixada como a expectativa da necessidade do utilizador (Benson 2010).

Berners-Lee e Hendler (2001) esclarecem que o principal objetivo da web semântica não é treinar as máquinas para que se comportem como pessoas, mas sim desenvolver tecnologias e linguagens que tornem a informação legível para as máquinas. A Web Semântica apresenta uma rede de dados em que cada nó apresenta um domínio distinto, contudo a relação

51

que cada elemente tem com os retantes é o factor de maior relevância. Deste modo, e porque a internet é uma rede de dados e não apenas uma rede de documentos e hipertexto (Berners-Lee (2001), as hiperligações entre os documentos de texto são substituídas por ligações de conjuntos de dados, dados e conceitos descritos em ontologias. Deste modo esta geração da web é também designada por Web dos dados ou Linked Data.

Tanto Benson como Luz e Marques dos Santos dizem que o caminho a seguir são as ontologias, como padrão descritivo e para tal Luz e Marques dos Santos (2016) propõem como abordagem possível para explorar a descrição arquivística da Web 3.0 começa com a redefinição do significado da descrição arquivística. A seguinte definição é proposta como um ponto de partida: A descrição arquivística é uma formalização que representa uma entidade de maneira acessível e que pode ser processada de maneira eficaz tanto por seres humanos quanto por máquinas.

Se a web proporciona esta possibilidade, considerando que é formado essencialmente por ligações, o controlo de autoridade no acesso à informação, poderá ocorrer conforme refere Campos (2003) de modo mais simples, pois os registos de autoridade, no ambiente partilhado e internacional que se prepara, não ficarão apenas ligados a registos bibliográficos mas sim a diversas comunidades, como editores, agências de direitos de autor, arquivos, museus e bibliotecas em geral. Idealmente, os registos de autoridade serão um elemento chave ou uma parte indispensável na infra-estrutura da Web Semântica, permitindo um acesso mais preciso à informação e ainda uma apresentação dessa informação na língua e escrita que o utilizador escolha.

Face ao acima exposto e considerando que as máquinas poderão identificar identidades e relações, a maior barreira para que esta metodologia ocorra será humana, que terá de organizar, caraterizar semanticamente e atualizar os dados, no caso dos conceitos, considerados chave.

1.2.4. O modelo tradicional vs o modelo sistémico na descrição da fotografia: