Para que a plataforma desenvolvida esteja acessívelonline, optou-se por utilizar um serviçocloud com- puting, permitindo agregar osoftwareehardware necessário para o funcionamento da plataforma. No entanto, existem vários modelos decloud, pelo que primeiro é necessário efetuar um levantamento dos ti- pos decloudexistentes, com o intuito de averiguar a que melhor se adequa às necessidades da plataforma de anotação de dados.
Ascloudspodem ser distinguidas pelo tipo de serviço:Infrastructure as a Service,Platform as a Service
eSoftware as a Service. Estes tipos decloudtêm diferentes níveis de abstração, resultando em diferentes níveis de complexidade e flexibilidade. Software as a Serviceé o tipo decloudque tem um maior nível de
abstração, sendo ideais para fornecer umsoftwarecomo um serviço, garantido o acesso aosoftwareem questão por parte dos utilizadores através da Internet, eliminando a necessidade de instalar osoftwareno computador pessoal dos seus utilizadores. Um exemplo disso é oGoogle Docs, proporcionando o acesso a um editor de texto através do browser. Assim, este tipo de serviço cloud tem um elevado nível de abstração, eliminando a necessidade de gerir as várias camadas subjacentes, comohardwaree sistema operativo.
Outro modelo decloud, com um menor nível de abstração comparativamente aoSoftware as a Service, é o de Platform as a Service. Este modelo decloud serve maioritariamente como uma ferramenta de suporte ao desenvolvimento de aplicações (Dillon, Wu, & Chang, 2010), permitindo o desenvolvimento da aplicação (através de ferramentas de desenvolvimento pré-instaladas), assim como a disponibilização da própria aplicação desenvolvida a utilizadores externos. São algumas as vantagens da utilização deste modelo de cloud, como o facto de não ser necessário instalar e configurar sistemas operativos, assim como a eliminação da necessidade de gerir as ferramentas de desenvolvimento. Contudo, tal é obtido à custa de uma diminuição no nível de flexibilidade.
O modelo decloud com o menor nível de abstração é o deInfraestruture as a Service, pelo que é o que apresenta maior complexidade, com um nível superior de flexibilidade em contrapartida. Este modelo de cloudassegura o acesso a uma infraestrutura de recursos computacionais, permitindo efetuar uma seleção daquele que é ohardwarepretendido, conforme as necessidades do projeto em questão. Além do mais, ao nível dosoftware, é possível efetuar a configuração desejada, tanto a nível de sistema operativo bem como as ferramentas nele instaladas, daí a maior flexibilidade proporcionada por este modelo de
cloud.
A Tabela 5 sumariza as ferramentas selecionadas para suportar o funcionamento da plataforma, e que têm que ser instaladas e configuradas no serviço decloud. Tanto o sistema operativo Ubuntu, bem como as ferramentas MariaDB e Nginx são open-source. No que diz respeito ao servidorweb adotado, uma alternativa válida seria o Apache, em detrimento do Nginx, no entanto selecionou-se o Nginx pelo facto de apresentar melhor desempenho e uma menor exigência de memória (Suciu, Scheianu, & Vochin, 2017).
Tabela 5: Várias ferramentas que suportam a plataforma de anotação de dados, bem como a função de cada uma delas.
Função Ferramenta adotada
Sistema Operativo Ubuntu 16.04 Server
Sistema de Gestão de Base de Dados MariaDB
Servidor Web Nginx
Feita a distinção dos vários modelos decloud, e tendo em conta a infraestrutura tecnológica necessária para o funcionamento daframework Laravel, foi concluído que uma solução do tipoInfraestructure as a Serviceseria ideal. Isto porque é necessário instalar vários componentes, como o Sistema de Gestão de Base de Dados (SGBD) e o servidorweb, assim como a devida configuração destes mesmos componentes para que interagem corretamente entre si, pelo que o elevado grau de flexibilidade associado a umacloud
de modeloInfrastructure as a Serviceé um requisito essencial.
Ao nível dos fornecedores de serviços cloud, estes são alguns dos que se enquadraram no modelo
Infrastructure as a Service: Amazon Elastic Compute Cloud, Google Cloud, Microsoft Azure e Digital Ocean. Destes fornecedores, optou-se por utilizar oAmazon Elastic Compute Cloud. A opção de utilizar este fornecedor recaiu maioritariamente sobre dois fatores:
• É o fornecedor com a maior percentagem demarket share(Panettieri, 2017), com cerca de 40% do mercado declouddo tipoInfrastructure as a Service;
• Foram oferecidos créditos de utilização, ao abrigo do programa para estudante daAmazon Elastic Compute Cloud, que nos permitem utilizar este serviço.
Como as exigências computacionais da plataforma são reduzidas, optou-se por utilizar a instância
t2.micro(nomenclatura utilizada naAmazon Elastic Compute Cloud), que se manifestou suficiente para as necessidades da plataforma. As caraterísticas dehardwaredesta instância são apresentadas na Tabela 6.
Tabela 6: Caraterísticas dehardware, tendo por base a instância t2.micro.
Componente Caraterísticas
CPU Intel Xeon CPU E5-2620 v3 2.40GHz
Memória RAM 1 GB
Capacidade de armazenamento 30 GB (Solid-State Drive)
Descrição da plataforma decrowdsourcing
A plataforma foi desenvolvida com recurso à framework de PHP Laravel e alojada na cloud. Para dar um aspeto mais profissional à aplicação, até porque se pretender obter o maior número de participantes possível é um fator importante, foi comprado um domínio, pelo que o acesso à plataforma é feito através do seguinte endereço:
http://classifyabstracts.info/
É uma plataforma web responsiva, pelo que se adapta a diferentes resoluções dos dispositivos, in- cluindo dispositivos móveis. A aplicação foi partilhada com alunos e docentes, maioritariamente pertences
à Universidade do Minho e Instituto Universitário de Lisboa, através de apelos à participação no processo decrowdsourcingefetuados poremail. À semelhança de Moura (2014), optou-se por utilizar um sistema deloginque apenas exige a introdução de umemail, seja ele fictício ou não. Esteemailapenas necessita de ter uma estrutura válida, ou seja, tem que obrigatoriamente conter o caracter ‘@’, bem como acabar com uma extensão de endereço válida, tais como ‘.net’, ‘.org’, ‘.com’ ou outras.
Optou-se por criar um sistema deloginno qual não é necessário a introdução de umapassword. Esta decisão está relacionado com o facto da plataforma ter sido divulgada apenas em grupos restritos perten- centes a instituições universitárias. Além do mais, este mecanismo de autenticação evita a confirmação de contas poremail, tornando o processo mais simples, visando impulsionar a participação no processo decrowdsourcing. Além do mais, esta opção de utilizar oemailcomo forma de autenticação, baseia-se no facto do utilizador não poder começar imediatamente a classificarabstracts, sendo o seu acesso inicial à plataforma bastante restrito. Para que não hajam restrições de acesso, o utilizador tem primeiro que completar um pequeno tutorial na plataforma, servindo como um mecanismo de filtragem de utilizadores mal intencionados. Poderá argumentar-se que um utilizador mal intencionado poderia despender o tempo necessário para completar o tutorial, contudo o mesmo é válido para umloginque necessite depassword
e email, visto que é relativamente simples criar e confirmar um emailfalso. Caso o utilizador assim o pretenda, poderá ser mesmo utilizado por parte do utilizador umemailfalso.
Seria também possível combinar ambas as abordagens, isto é, ser estritamente necessário umemail
válido bem como completar o tutorial de iniciação para conseguir participar na plataforma. No entanto, tal poderia aumentar em demasia o esforço necessário para que um utilizador conseguisse participar ativamente na plataforma, resultando numa provável diminuição do número de participantes no processo decrowdsourcing.
Caso o utilizador não esteja autenticado, será apresentada a este a página inicial da plataforma. Na página inicial, como demonstrado na Figura 15, são apresentados ao utilizador vários detalhes e instruções relativas à plataforma.
Figura 15: Página de entrada da plataforma.
A plataforma é responsiva, pelo que também também pode ser utilizada emsmartphones, como de- monstra a Figura 16.
Figura 16: Página de entrada vista numsmartphone.
Após o utilizador estar autenticado, é necessário que este complete um tutorial de iniciação. O utilizador apenas necessita de completar este tutorial se ainda não o tiver feito no passado. A primeira etapa deste tutorial consiste em ler alguns exemplos de classificações para frases deabstracts, para que o utilizador se familiarize com as classificações possíveis de frases de abstracts. Esta primeira etapa do tutorial é apresentada na Figura 17.
Figura 17: Primeira etapa do tutorial de iniciação.
Na segunda e última etapa do tutorial de iniciação, o utilizador deverá classificar corretamente cada uma das frases de umabstract. Caso as respostas dadas estejam corretas, o utilizador poderá começar a classificarabstractsna plataforma decrowdsourcing, sendo-lhe atribuídos de forma automática os devidos acessos.
Para simplificar o processo de anotação, a seleção da classificação de cada uma das frases é feita através dedropdowns, como demonstra a Figura 18.
Figura 18: Segunda e última etapa do tutorial de iniciação.
Caso as respostas estejam erradas, é apresentado um aviso a indicar tal facto, e o utilizador terá que repetir a última etapa do tutorial. Esta situação é apresentada na Figura 19.
Figura 19: Aviso de respostas erradas na última etapa do tutorial.
No caso das respostas dadas na última etapa do tutorial estarem corretas, o utilizador passará a ter acesso a todas as funcionalidades presentes na plataforma. A classificação das frases é feita através de dropwdowns, para tornar o processo de classificação o mais simples e rápido possível, visto que o utilizador apenas necessita de selecionar a classe apropriada para cada uma das frases e no fim carregar no botãoSubmit. A página onde é efetuada a classificação dosabstractsestá presente na Figura 20.
Figura 20: Página onde se procede à classificação das frases doabstract.
Após o utilizador classificar as frases doabstract, é demonstrada uma mensagem que indica o número deabstractsjá classificados pelo utilizador. O utilizador pode ainda continuar a classificarabstracts, como evidenciado na Figura 21.
Figura 21: Aspeto da páginas após classificação de umabstract.
Como incentivo extrínseco, foram introduzidos componentes degamification, como pontos, sendo que estes possibilitam o desbloqueio de diferentes níveis. Esses pontos são atribuídos em equivalência ao número de abstracts classificados pelo utilizador, sendo que os pontos necessários para alcançar cada um dos níveis estão identificados na Tabela 7.
Tabela 7: Pontos necessário para alcançar cada um dos níveis
Nível Pontos necessário para alcançar o nível
Bronze 10
Prata 50
Ouro 100
O utilizador pode ver o seu progresso, nomeadamente para consultar os níveis que já atingiu bem como os que faltam ainda atingir, na páginaAchievements, como evidenciado na Figura 22. Nessa página os participantes podem verificar quantos pontos já têm, que níveis já foram atingidos, o número de pontos
necessários para atingir cada um dos níveis, bem como o diferencial (caso exista) entre o número de pontos já obtidos e o número de pontos necessários para cada nível. Cada um dos níveis (bronze, prata e ouro) está destacado com as respetivas cores.
Figura 22: Página deachievements.
No que diz respeito à participação no processo de crowdsourcing, constatou-se que uma pequena percentagem dos utilizadores tem uma contribuição substancial no processo de anotação de dados, tendo sido poucos os utilizadores que classificaram mais de 50 abstracts, como comprovável na Figura 23. A vasta maioria dos utilizadores classificou entre 1 a 10 abstracts, tendo sido 100 abstracts o número máximo deabstractsclassificados por um utilizador. Este tipo de fenómeno, relativo à desigualdade no esforço dedicado pelos participantes no processo de crowdsourcing, é comum em comunidadesonline
nas quais o seu funcionamento tenha por base o contributo dos participantes da comunidade, onde são comuns situações nas quais apenas uma pequena percentagem de utilizadores tem uma contribuição significativa (Nielsen, 2006).
Figura 23: Gráfico que demonstra o número de utilizadores consoante o intervalo deabstracts classificados.
No total, 76 utilizadores diferentes efetuaramloginna plataforma. Contudo, nem todos os utilizadores chegaram a integrar o processo decrowdsourcing, visto que alguns deles não completaram o tutorial de iniciação. A função do tutorial de iniciação é familiarizar os indivíduos com os conceitos e mecanismos utilizados na plataforma. Deste modo, quem não completar o tutorial de iniciação tem um acesso restrito à plataforma, não sendo possível a esses utilizadores procederem à classificação deabstracts. No gráfico presente na Figura 24 são comparados os números de utilizadores por tipo de acesso, sendo visível que a maioria dos utilizadores completou o tutorial de iniciação, tendo acesso total às funcionalidades da plataforma.
Figura 24: Comparação entre o número de utilizadores que têm acesso total à plataforma, pois completaram o tutorial de iniciação, e o número de utilizadores com acesso restrito.