• No results found

S OCIAL CAPITAL : HOW IMPORTANT HAS IT BEEN ?

5. CASE STUDY: APROCAMP PRODUCERS, BENEFITING FROM A STABLE FAIR

5.5 S OCIAL CAPITAL : HOW IMPORTANT HAS IT BEEN ?

O avanço do progresso e disseminação das redes, armazenamento e tecnologias de processamento tem impulsionado a criação de base de dados gigantescas com grande volume de informações transacionais. Em paralelo, com o dramático crescimento de dados digitais, preocupações em relação à privacidade emergem globalmente. A questão da privacidade ganha destaque pela facilidade de se coletar e adicionar informações de modo automático a bases de dados. A mineração de dados que promete eficiência na descoberta de valor em informações

não óbvias a partir de grandes bases de dados é particularmente vulnerável ao uso indevido. Por isso, é importante que na mineração de dados sejam incorporadas preocupações com a privacidade (AGRAWAL; SRIKANT, 2000).

A mineração de dados é o processo de extração de informação útil a partir de grandes quantidades de dados. Pode ser utilizado para descrever a coleta de dados agregados, encontrando correlações nos dados ou no uso dos dados com o fim de fazer previsões. Embora essas técnicas tenham diferentes consequências para a privacidade, um tema comum na mineração de dados é a coleta de grande volume de dados, que aumenta as questões sobre privacidade. Surge a indagação sobre se a pessoa, sujeito dos dados, está consciente de que eles serão objeto de mineração. Quando o usuário concorda que as suas informações sejam utilizadas para a mineração, ele tem pouco conhecimento do que exatamente será feito com as suas informações (PRIVACY INTERNATIONAL, 2015b).

Assim, Reddy e Shilpa (2015), também, entendem que, a despeito de a informação descoberta pela mineração de dados ser muito valiosa para várias aplicações, as pessoas têm mostrado crescente preocupação sobre o outro lado da moeda, nomeadamente ameaças à privacidade colocadas pela mineração de dados. A privacidade individual pode ser violada devido ao acesso não autorizado de dados pessoais, a descoberta indesejada de alguém sobre informações embaraçosas, o uso de dados pessoais para outros fins do que aquele que para o qual o dado foi coletado.

Para lidar com as questões de privacidade na mineração de dados, os autores assinalam que a preservação da privacidade na mineração de dados ou privacy-preserving data mining (PPDM) tem ganho grande desenvolvimento. O objetivo da PPDM é prover salvaguardas às informações sensíveis de divulgações não solicitadas e, ao mesmo tempo, preservar a utilidade dos dados. A PPDM tem dois lados: primeiro, dados sensíveis, tais como identidade, número de celular, não devem ser diretamente utilizados na mineração; segundo, resultados sensíveis da mineração cuja divulgação podem resultar em violação da privacidade devem ser excluídos. Com base nos estágios do processo da descoberta de conhecimento e mineração de dados ou knowledge discovery and data mining (KDDM) na Figura 17, é possível identificar quatro tipos de usuários, num cenário típico de mineração de dados:

a) fornecedor de dados: o usuário que possui alguns dados que são interessantes para o trabalho de mineração de dados;

b) coletor de dados: o usuário que coleta os dados a partir de fornecedores de dados e então publica os dados para o minerador de dados;

c) minerador de dados: o usuário que executa a mineração de dados;

d) responsável pela tomada de decisão: o usuário que toma as decisões com base nos resultados da mineração a fim de alcançar determinados objetivos.

Figura 17 - Descoberta de Conhecimento e Mineração de Dados

Fonte: XU et al (2014)

Nesse contexto, Reddy e Shilpa (2015) aprofundam a discussão em torno das principais questões envolvendo esses atores, bem como pontos de atenção no processo de mineração de dados, em especial sobre possíveis danos à privacidade:

a) fornecedor de dados: a maior preocupação do fornecedor de dados é se ele pode controlar a sensibilidade dos dados fornecidos ao coletor de dados. Primeiramente, o provedor deve ser capaz de garantir de que os dados privados não serão divulgados a qualquer um. Em segundo, no fornecimento de dados ao coletor, é necessário ocultar informações sensíveis o quanto possível;

b) coletor de dados: os dados coletados de fornecedores de dados podem conter informações pessoais sensíveis. A divulgação direta de dados ao minerador de dados pode violar a privacidade dos dados do fornecedor, então, são necessárias modificações nos dados. De outro lado, os dados devem ser úteis após essa modificação, ao contrário, a coleta dos dados não terá utilidade. Assim, a maior preocupação do coletor de dados é ter certeza de que os dados modificados não contêm qualquer informação sensível, mas ainda possuem grande utilidade;

c) minerador de dados: o minerador de dados aplica algoritmos de mineração aos dados recebidos do coletor e deseja extrair informações úteis a partir dos dados de maneira

a preservar a privacidade. PPDM cobre dois tipos de proteções, nomeadas proteção de dados sensíveis e proteção de resultados sensíveis de mineração. Com a metodologia baseada em papéis, o coletor de dados deveria ter a maior responsabilidade na proteção de dados sensíveis, enquanto o minerador pode dar foco em como ocultar resultados sensíveis em relação a terceiros não confiáveis; e d) responsável pela tomada de decisão: o responsável pela tomada de decisão pode

obter os resultados da mineração diretamente com o minerador de dados ou de algum transmissor de informações. O transmissor de informações atua para alterar os resultados da mineração de modo intencional ou não, e pode causar sérias perdas para a tomada de decisão. Portanto, o tomador de decisão tem como preocupação se os resultados da mineração são confiáveis e, adicionalmente, pode investigar as abordagens adotadas por cada papel de usuário.

Em linha, Drogkaris e Gritzalis (2015) também discutiram as questões que envolvem a privacidade e a mineração de dados. Assim, Data Mining ou Mineração de Dados refere-se à atividade extrair informações relevantes ou pertinentes e a operações que envolvem sofisticadas operações de pesquisa que retornam alvos e resultados específicos. A mineração de dados é geralmente tratada na literatura como sinônimo de Knowledge Discovery and Data Mining (KDDM) ou Descoberta de Conhecimento e Mineração de Dados que destaca o objetivo dos resultados no processo de mineração. A fim de adquirir conhecimento útil a partir de dados, o fluxo descrito na Figura 18 tem de ser performada do seguinte modo:

a) passo 1: pré-processamento de dados: operações básicas que incluem a seleção de dados, limpeza dos dados e integração dos dados;

b) passo 2: transformação dos dados: operações caracterizadas pela seleção e transformação dos dados em formas apropriadas para a mineração;

c) passo 3: mineração de dados: aplicação de métodos inteligentes e técnicas de representação que extraem informações valiosas.

De acordo com os autores, o surgimento do KDDM revitalizou questões relativas ao uso secundário de informações pessoais e acesso granulado de informações pessoais. Na visão dos autores, o modo mais realístico de preservar a privacidade da informação poderia ser encriptá- la. Usuários desejando ter acesso aos dados poderiam utilizar chaves de decriptação e isto poderia resolver todas as questões emergentes de privacidade. Infelizmente, essa abordagem pode não funcionar no cenário da mineração de dados, no qual a informação deve estar disponível, mas o sujeito dos dados deve ser mantido no anonimato. A noção chave neste

conceito é a utilidade: o objetivo das medidas de preservação da privacidade é assegurar acesso a informações confidenciais e, ao mesmo tempo, liberar informações. É possível alcançar a perfeita privacidade por meio da não disponibilização de dados, porém essa solução não tem nenhuma utilidade.

Figura 18 - Processo de descoberta de conhecimento na mineração de dados

Fonte: Drogkaris e Gritzalis (2015)

Xu et al (2014) reafirmam a preocupação com a privacidade, alegando que nada obstante o fato de que a informação descoberta por processos de mineração de dados ser valiosa para muitas aplicações, as pessoas têm mostrado crescente preocupação sobre as ameaças à privacidade provocadas pela mineração de dados. A privacidade do indivíduo pode ser violada devido ao acesso não autorizado de dados pessoais, descobertas indesejáveis de informações embaraçosas, o uso de dados pessoais para outros propósitos que não aqueles para os quais os dados foram coletados. Como exemplo, o varejista americano Target recebeu reclamações de um cliente que estava irritado com o envio de cupons de desconto para roupas de bebê para sua filha adolescente. Entretanto, era verdade que a sua filha estava grávida naquela ocasião e a Target corretamente inferiu o fato por conta da mineração de dados do cliente. A partir desta história, podemos ver o conflito que existe entre a mineração de dados e a segurança da privacidade.

Historicamente, o dever de confidencialidade aumentou com respeito à informação fornecida no contexto do relacionamento profissional, a exemplo daquele entre uma pessoa e seu médico, advogado ou sacerdote. Em tais relações, o confidente está sob a obrigação de manter o sigilo da informação obtida no curso desse relacionamento. O dever de sigilo também se aplica aos detentores de informações que, apesar de não serem classificadas como confidenciais, podem, de algum modo, ser detalhadas o suficiente para a identificação dos sujeitos vinculados a esses dados. Como exemplo, temos os dados relativos à saúde individual que cruzados com outras fontes podem trazer à tona informações pessoais e sensíveis. Nesse

caso, há informações que podem identificar indivíduos e dados sensíveis por conta de incluir aspectos da saúde individual e cuidados médicos dispensados, além de serviços recebidos. Em muitos casos, os dados são uma forma de revelação do relacionamento confidencial entre pacientes e seus provedores de cuidados. Nesse contexto, a decisão sobre o uso dos dados deve considerar o equilíbrio entre os benefícios sociais e os riscos, num contexto em que se maximize esses benefícios e minimize os riscos (OECD, 2015), conforme exposto no Anexo D, a partir de um exemplo que envolve cuidados médicos e de saúde.

O quadro apresentado sinaliza, ao centro, que a tomada de decisão sobre o uso de dados pessoais deve considerar tanto os riscos quanto os benefícios decorrentes de sua utilização. Do lado esquerdo estão os benefícios e à direita os riscos. Para efeito de ilustração, exemplos de benefícios são mostrados no lado direito, tais como os direitos individuais e valores da sociedade, benefícios diretos para os pacientes e benefícios para o sistema de saúde como eficiência e inovação. Exemplos de riscos são mostrados à esquerda incluindo a violação de direitos à privacidade, diminuição da confiança da sociedade em relação ao governo e provedores de cuidados de saúde, desrespeito aos valores da sociedade em relação à privacidade e compartilhamento de dados, acarretando a perda de privacidade, roubo de identidade, levando à perda de participação de mercado pelos provedores de cuidados médicos. A segunda dimensão do quadro é a governança de dados, onde a utilização ótima dos dados só pode ser alcançada se houver uma estrutura otimizada para minimizar os riscos sociais do uso de dados e para maximizar os benefícios sociais. Desse modo, as setas à direita e à esquerda do diagrama ilustram os mecanismos que podem aumentar os benefícios sociais e reduzir os riscos sociais do uso de dados.

Com o grande desenvolvimento das informações e redes, Meng e Zhang (2015) entendem que o Big Data se tornou um tópico relevante na pesquisa acadêmica e industrial, que é reconhecido como uma nova revolução no campo da tecnologia da informação. No entanto, ele traz não somente benefícios sociais e econômicos significantes, mas também grandes riscos e desafios à preservação da privacidade dos indivíduos e segurança de dados. Atualmente, a privacidade relacionada com Big Data tem sido considerada como um dos grandes problemas em muitas aplicações. Os autores disponibilizam uma estrutura ativa para o gerenciamento da preservação da privacidade e do gerenciamento da privacidade do Big Data à luz dos problemas atuais de privacidade. Sob essa estrutura, ilustramos os desafios tecnológicos da preservação da privacidade no Big Data.

Os autores modelam uma estrutura de gerenciamento de preservação de privacidade, conforme disposto na Figura 19, considerando o proprietário dos dados e elementos como dados privados, políticas de privacidade e ferramentas adaptativas que podem ser aplicadas para a manutenção e preservação da privacidade como privacidade diferencial, anonimização, encriptação e sistemas responsáveis, a partir de tarefas que geram a produção de informações, num ciclo iterativo.

Figura 19 Estrutura de preservação da privacidade

Fonte: Meng e Zhang (2015)

Considerando o Big Data, na Figura 20, Meng e Zhang (2015) desenvolveram uma estrutura de gerenciamento de privacidade, levando em conta toda a gama de fatores e elementos complexos que compõem o fluxo como leis e regulamentos; sistemas responsáveis; e mecanismos ativos como tecnologias de gerenciamento de privacidade, avaliação e monitoramento do risco de ofensa à privacidade:

Figura 20 Estrutura de gerenciamento da privacidade - Big Data

Fonte: Meng e Zhang (2015)