3. THE CONTEXTUAL FACTORS
3.1 C ONSTRAINTS
3.1.2 Land
Um desafio em particular que merece destaque, no tocante à privacidade, é deixar clara a distinção entre dados pessoais e impessoais. O relatório da Organisation for Economic Co- operation and Development (2013b) Guidelines Governing the Protection of Privacy and Transborder Flows of Personal Data define como dados pessoais qualquer informação relativa a um indivíduo identificado ou identificável, ou seja, a pessoa a quem os dados se referem ou sujeito do dado. Entretanto, os analistas de dados têm conseguido, de maneira fácil, relacionar dados não pessoais a indivíduos identificados ou identificáveis, fato que torna difícil a diferenciação entre os dados pessoais e não pessoais e, com isso, surge como resultado o desafio para qualquer abordagem regulatória que determine a aplicabilidade de direitos, restrições e obrigações considerando a natureza pessoal dos dados envolvidos.
De acordo com a OECD (2013b), a distinção entre o que são dados pessoais e aqueles que não são está se tornando gradualmente mais difícil. O progresso tecnológico cada vez mais permite que os dados sejam combinados com outros dados e nesse processo possam permitir a identificação de indivíduos. Tal progresso coloca desafios às abordagens de privacidade e amplia a quantidade e categorias de dados que são trazidos ao escopo de vários regimes de privacidade e a exequibilidade da proteção disponibilizada pelos princípios de privacidade. Questões sobre obter consentimento, transparência, qualidade de dados, acesso e salvaguardas são alguns dos princípios-chave de proteção dos dados que lançam mais desafios a esse respeito.
A título de exemplo, na Alemanha, o Google deparou-se com protestos do público e da mídia, em face do receio popular de que as fotos das casas e jardins pudessem servir de ajuda para criminosos selecionar alvos mais lucrativos. Por conta da pressão regulatória, o Google concordou que os donos das residências pudessem optar para que a imagem de suas casas fosse borrada. Porém, essas imagens manchadas podiam ser notadas pelo Street View e, desse modo, os ladrões poderiam interpretar que isto era o sinal de que esses locais eram bons alvos para o crime (MAYER-SCHÖNBERGER; CUKIER, 2013).
A divulgação de dados que contenham referências pessoais é um problema considerável, em face de trazer informações como nome, seguro social, condição médica, código de endereçamento postal, idade, sexo. Se porventura os indivíduos vinculados a esses dados forem identificados, então as suas informações privadas, como, por exemplo, a sua condição de saúde, poderão ser divulgadas (MACHANAVAJJHALA et al, 2007).
A OECD (2013a) firma o entendimento de que dados pessoais se referem a qualquer informação relacionada a um indivíduo identificado ou identificável, titular dos dados ou sujeito dos dados (data subject). Este é um conceito amplo que inclui os seguintes tipos de dados:
a) conteúdo gerado pelo usuário, incluindo blogs e comentários, fotos e vídeos; b) dados relacionados a atividade ou comportamento, incluindo o que as pessoas
pesquisam e consideram na Internet, o que as pessoas compram on-line, o quanto e como elas pagam;
c) dados sociais, incluindo contatos e amigos em sites de redes sociais;
d) dados de localização, incluindo endereço residencial, GPS e geolocalização, de telefones móveis e endereço de IP;
e) dados demográficos, incluindo idade, gênero, raça, renda, preferências sexuais, afiliação política;
f) dados identificados de natureza oficial, incluindo nome, informações financeiras e número de conta bancária, informação sobre saúde, número de identidade, registros policiais.
A Information Systems Audit and Control Association (2013b) afirma que os dados pessoais podem ser classificados como:
a) dado voluntário: criado e explicitamente compartilhado por indivíduos, por exemplo, perfis de redes sociais;
b) dado observado: capturado ao gravar as ações dos indivíduos, por exemplo, dados de localização no uso de telefones celulares;
c) dado inferido: dado sobre indivíduos com base em informação voluntariada ou observada, por exemplo, classificações de crédito.
De acordo com Pentland (2014), seria infrutífera a tentativa de se definir uma taxonomia dos tipos e usos de dados, por conta do rápido avanço da tecnologia. Mas é possível prover uma taxonomia mais abrangente focada em termos de controle. Com base nisso, são citadas três principais divisões com direcionamento para o controle de dados: (1) data commons, que estão disponíveis para todos, com menor limitação ao seu uso; (2) dados proprietários ou pessoais:
tipicamente controlados por indivíduos ou companhias e para os quais a infraestrutura legal e tecnológica deve prover mecanismos estritos de controle e auditoria; (3) dados secretos do governo: possuem controles mais fortes e menor acesso direto pelo público.
Questões voltadas para a propriedade de dados e privacidade, dando o controle sobre os dados para os indivíduos devem ser debatidas, com o provimento de transparência e engajamento das esferas pública e privada. O desafio continua nas grandes corporações, em particular governos e empresas que podem abusar do poder dos dados. Para endereçar essa questão, é necessário estabelecer melhores práticas que são do interesse tanto para as grandes organizações quanto para os indivíduos. Com isso, no entendimento do autor, as principais recomendações para as grandes corporações e governo seriam:
a) as grandes bases de dados devem ser armazenadas de maneira descentralizada, separada por tipo e em categorias, individuais e corporativas. Esses sistemas devem ser gerenciados por departamento cuja função está associada aos respectivos dados, com definição e monitoramento das permissões de compartilhamento. As melhores práticas indicam o uso de sistemas computacionais heterogêneos e custódia dos dados regionalizada. Com essas salvaguardas, as eventuais tentativas de violação e serão menos exitosas por conta da dificuldade de combinar os tipos de dados diferentes sem a adequada autorização;
b) o compartilhamento de dados sempre deve obedecer a combinação de permissões com os tipos de dados e reporte automático para a auditoria;
c) os sistemas controlados por organizações parceiras e não apenas os próprios sistemas devem ser seguros. Dados externos compartilhados devem transitar apenas em sistemas com controle e redes confiáveis, procedência e auditoria;
d) a necessidade de um ecossistema de dados seguro se estende aos dados individuais privados e aos dados de propriedade de companhias parceiras. Como consequência, a melhor prática para o fluxo de dados para e de cidadãos e negócios deve exigir que o armazenamento de dados pessoais seja seguro e envolvido por uma rede confiável; e) todas entidades devem prover mecanismos para identificação segura de credenciais.
A melhor prática é basear essas credenciais em assinaturas biométricas;
f) criar um banco de data commons aberto que seja acessível por parceiros sob acordo mínimo com as condições de uso e acesso.
Apesar de essas recomendações parecerem muito rígidas à primeira vista, elas são, para a maior parte de organizações, de implementação simples com os protocolos já existentes nas
redes e bancos de dados de computadores. Em muitos casos, o uso de armazenamento e gerenciamento de bases de dados descentralizados já é prática corrente e para o sistema como um todo será simples e com baixo custo de implementação do que uma solução centralizada. Essas recomendações resultam num ecossistema de dados que é mais seguro e resiliente, permitindo a obtenção segura das vantagens do uso do Big Data (PENTLAND, 2014).
Outra distinção comum é entre informações pessoalmente identificáveis ou personally identifiable information (PII), e não PII. PII é o dado que identifica uma pessoa diretamente, enquanto o não PII é geralmente considerado não passível de identificação em si, apesar disso, a distinção não é sempre clara. Por exemplo, PII tipicamente inclui nome e endereço, número de identidade, registros médicos e financeiros. O não PII inclui dados relacionados a quais termos são buscados em websites que foram visitados, o que é comprado on-line e como aquilo que é comprado é pago. Há menos certeza sobre a categorização de alguns outros tipos de informação, como posição de GPS, endereço de IP, e há também incerteza como os métodos analíticos são aperfeiçoados e permitem grandes combinações de peças de informação que são os próprios não PII, mas que, em combinação, pode permitir que pessoas sejam identificados (OECD, 2013a).
De acordo com Narayanan e Shmatikov (2010), as informações pessoalmente identificáveis têm se tornado a pedra filosofal da privacidade. Para um conceito que é tão disseminado em ambos discursos tecnológico e legal da privacidade dos dados, PII é supreendentemente difícil de definir. A definição de informação pessoal, segundo a legislação norte-americana, inclui número do seguro social, número da carteira de habilitação de motorista, movimentação de contas bancárias, mas não, por exemplo, endereço de e-mails ou número de telefones. Essa definição foi estabelecida em resposta a violações de segurança, envolvendo dados que poderiam permitir o roubo de identidade. Portanto, o seu foco, exclusivamente, em tipos de dados que são comumente utilizados para a autenticação de um indivíduo, ao contrário daquelas relativas que violam a privacidade, ou seja, que revelam algum tipo de informação sensível sobre um indivíduo, porém, essa distinção fundamental é geralmente negligenciada por desenvolvedores de tecnologias de preservação da privacidade.
personally identifiable information informação pessoalmente identificável é aplicado são as leis de privacidade, como a Diretiva de Proteção de Dados da União Europeia. As leis sobre privacidade definem PII de um modo muito abrangente. Elas apontam para a possibilidade de divulgação dedutiva, diferentes leis de notificação de violação, que não estabelecem uma lista informacional sobre os atributos que
constituem PII. Por exemplo, a Diretiva de Proteção de Dados da União Europeia define dado pessoal como qualquer informação relativa a uma pessoa natural que pode ser identificada direta ou indiretamente, em particular por referência a um ou mais fatores específicos à sua identidade física, psicológica, mental, econômica, cultural ou social.