Home > Gestão

13 mandamentos para cientistas de dados

Com as empresas tornando-se especialistas no fatiamento de dados para revelar detalhes muito pessoais a ameaça de violações de privacidade cresce. O que fazer?

Cindy Waxer, CIO/EUA

05/11/2013 às 8h18

mandamentos_164719115.jpg
Foto:

Mais do que simplesmente bits e bytes, o Data Analytics é agora uma oportunidade de negócio multibilionário. Organizações mais experientes, dos varejistas aos fabricantes, estão rapidamente descobrindo o poder de transformar em insights os códigos postais dos consumidores e seu histórico de compras.
Estudo recente do Boston Consulting Group revela que os dados pessoais podem ajudar as empresas a atingirem maior eficiência. Aproveitar o poder da análise de dados é claramente uma vantagem competitiva. Por outro lado, a mineração de dados com excesso de zelo pode facilmente sair pela culatra. Com as empresas tornando-se especialistas no fatiamento de dados para revelar detalhes tão pessoais como a inadimplência das hipotecas e os riscos de ataque cardíaco, a ameaça de violações de privacidade cresce.

Basta perguntar a Kord Davis, estrategista digital e autor de "Ética do Big Data: Risco de equilíbrio e Inovação". Segundo ele, "os valores que você infundir em suas práticas de manipulação de dados pode ter algumas consequências muito reais".

"As organizações que são transparentes sobre o seu uso de dados são capaz de usar isso como uma vantagem competitiva", afirma Davis. "As pessoas estão começando a se tornar muito interessadas no que pode acontecer lá fora, com seus dados. Portanto, organizações éticas no compartilhamento de informações estarão uma posição muito melhor par se tornarem confiáveis."

"Há muitas vantagens em ter os dados analisados e empresas adaptando produtos e serviços específicos para as preferências dos clientes. Mas é realmente interesse das empresas respeitarem os dados privados das pessoas?

Honestidade é realmente a melhor política 
Profissionais de TI estão descobrindo que equilibrar o poder de algoritmos sofisticados com os direitos do consumidor é mais do que evitar a má publicidade ou a perda de vendas. Nos dias de hoje, vale a pena ser honesto - literalmente.

Muitos CIOs e cientistas de dados já enfrentam o desafio de calcular o valor real dos dados confidenciais e seus insights respeitando os direitos dos consumidores e até mesmo procurando ganhar a sua confiança. Como a disponibilidade de dados cresce, e as técnicas de manipulação se multiplicam, alguns profissionais de TI estão tomando o assunto em suas próprias mãos, com abordagens inovadoras para a prevenção de abusos.

A empresa de análise de dados californiana Retention Science é um exemplo perfeito. Usa algoritmos de previsão e dados, como renda familiar, histórico de compras e pontuação de crédito para ajudar as empresas a preverem a probabilidade de compra de um cliente e criarem campanhas de retenção. Além dos dados fornecidos pelo cliente, a Retention Science também conta com os dados que licencia de terceiros para atingir os consumidores certos, no momento certo.

Para criar campanhas direcionadas respeitando a privacidade dos consumidores a Retention Science estabeleceu regras rígidas e rápidas que regem o uso de dados. Por um lado, a empresa se recusa a compartilhar dados entre clientes. Por exemplo, se a Gap fosse cliente, e tivesse fornecido dados de consumidores à Retention Science, essa informação jamais seria compartilhada - mesmo anonimamente - com outros clientes de varejo.

Além disso, apesar de lidar com terabytes de dados confidenciais, a Retention Science obriga que todos os seus cientistas de dados, muitos dos quais professores e pesquisadores, assinem acordos de confidencialidade. "Eles não têm permissão para compartilhar ou usar os dados em qualquer outro lugar ou para suas próprias publicações", diz Jerry Jao, CEO da companhia.

Além de manter seus próprios funcionários responsáveis pela confidencialidade dos dados, a Retention Science também "só trabalha com empresas totalmente empenhadas em obter o consentimento dos consumidores antes de usar seus dados", diz Jao. "Nós não queremos incluir informações de indivíduos se eles não concederem no acesso a elas em primeiro lugar."

Transparência também é importante

Embora a definição de controles internos ajude, as empresas interessadas na mineração de dados podem dar um passo adiante, oferecendo aos consumidores acesso em primeira mão sobre tudo o que sabem sobre eles. A BlueKai, de Cupertino, também na Califórnia, é um bom exemplo de política de livro aberto. Ela oferece uma plataforma de gerenciamento de dados na qual comerciantes e editores podem gerenciar e ativar dados para a construção de campanhas de marketing direcionadas.

Considere, por exemplo, uma mulher interessada em comprar uma bicicleta vermelha. Como ela visita diferentes sites de artigos esportivos que fazem parceria com BlueKai, uma coleção de cookies anônimos são armazenados em seu browser. Com base nesse histórico de navegação, parceiros de marketing da BlueKai exibem anúncios comportamentais no computador da mulher, relevantes para sua busca pela bicicleta vermelha ideal.

A BlueKai torna esse processo mais transparente, e ainda permite que os visitantes optem por sair do registro totalmente ou por atualizar seus perfis anônimos, alterando as suas preferencias.

O pensamento por trás dessa prática da companhia é o de que, "se há dados conhecidos e negociáveis, eles devem ser completamente controlados pelos consumidores." Por esta razão, a BlueKai também incentiva seus parceiros a promoverem uma maior transparência, adotando a prática em seus próprios sites.

Os varejistas precisam fazer um trabalho muito melhor de uso dos dados que já possuem para atingir seus clientes. Têm que ter cuidado para que esse uso não seja visto como invasivo, para não terem problemas e perderem a confiança de seus clientes. Então, qual tem sido a solução? Estabelecer os incentivos corretos" para que as pessoas concordem em divulgar seus dados pessoais. 

Essa mesma regra de reciprocidade se aplica ao conteúdo online. Quando você pergunta se as pessoas preferem pagar por seu conteúdo ou terem anúncios direcionados ao lado desse conteúdo, geralmente 90% das pessoas preferem ter conteúdo patrocinado. 

Código de conduta
No entanto, nem todos acreditam que a carga deve ser colocada sobre o consumidor. Não se trata apenas de fazê-lo concordar alegremente em compartilhar seus dados, decifrar as confusas políticas de privacidade ou pontuações de crédito para a troca de cupons de supermercado. Na opinião de Michael Walker, os profissionais Big Data devem adotar um código de ética. Sócio-gerente da Rosa Business Technologies, integradora de sistemas com base em Denver, Walker elaborou um código de conduta para os profissionais de Big Data que cobre tudo, desde o papel dos cientistas de dados até suas responsabilidades diárias.

De acordo com Michael Walker, os cientistas de dados devem ser

considerados a altos níveis de padrões éticos, assim como médicos e advogados.

Para esse fim ele criou um conjunto de mandamentos para os trituradores

de dados – uma lista que tem como objetivo manter os cientistas de dados na

conduta correta enquanto preserva a privacidade do consumidor.

mandamentos

Na visão de Walker, os cientistas de dados não devem:

1. Falhar em utilizar métodos científicos no desempenho da ciência de dados.

2. Falhar em classificar a qualidade da evidência de uma maneira razoável e

compreensível para o cliente.

3. Alegar que evidências fracas ou incertas sejam evidências fortes.

4. Fazer mau uso de evidências fracas ou incertas para comunicar uma realidade

falsa ou promover uma ilusão de compreensão.

5. Falhar em classificar a qualidade dos dados de modo razoável e compreensível

para o cliente.

6. Alegar que dados ruins ou incertos são dados bons.

7. Fazer mau uso de dados de qualidade ruim ou incerta para comunicar uma

realidade falsa ou promover uma ilusão de compreensão.

8. Falhar em divulgar tudo e todos os resultados de ciência de dados ou envolver-
se no ocultamento de evidências.

9. Falhar em tentar replicar os resultados da ciência de dados.

10. Falhar em divulgar que tais resultados de ciência de dados não puderam ser

replicados.

11. Fazer mal uso dos resultados da ciência de dados para comunicar uma

realidade falsa ou promover uma ilusão de compreensão.

12. Falhar em divulgar experimentos fracassados ou evidências refutativas

familiares ao cientista de dados para ser diretamente adverso à posição do

cliente.

13. Oferecer evidência que o cientista de dados sabe ser falsa.

Caso um cientista de dados questione a qualidade dos dados ou evidência, ele

deve divulgar isto para o cliente. Caso um cientista tenha oferecido evidência

material e depois descubra que a mesma é falsa, ele deve tomar as medidas

corretivas razoáveis, incluindo a divulgação para o cliente. Um cientista de dados

deve divulgar e rotular as evidências que ele acredita razoavelmente serem

falsas.

"As empresas estão começando a entender o perigo de utilizações secundárias de informação e dos abusos com os dados pessoais das pessoas", diz Walker. "Uma vez que elas começam a pensar sobre isso, passam a ser muito favoráveis à adoção de um código de ética."

De fato, em uma pesquisa de agosto de 2013, conduzida pela Revolution Analytics, 80% dos entrevistados disseram concordar com a existência de um quadro ético para coleta e uso de dados. E mais da metade dos cientistas de dados pesquisados concordaram que a ética já desempenha um papel importante em suas pesquisas.

"A minha solução é ter algum tipo de código de conduta profissional que os cientistas de dados concordem voluntariamente a seguir para proteger os dados confidenciais das pessoas", diz Walker. Só através da criação de uma espécie de Juramento de Hipócrates para profissionais de análises de dados, Walker acredita que os cientistas de dados venham a ter as bases morais e legais para se recusarem a usar dados de maneiras que ameacem violar os direitos de privacidade dos consumidores.

Apesar das nobres intenções, é muito fácil deixar de cumprir um código de ética escrito em um pedaço de papel e esquecido no fundo de uma gaveta. O desafio, diz ele, "é compreender o que você realmente faz com dados e alinhar com os valores compartilhados na organização." Infelizmente, diz ele, determinar os reais valores de uma organização, e se as suas práticas de dados refletem ou não essas prioridades, é uma conversa muito diferente da que estamos acostumados a ver em um ambiente “empresarial."

Junte-se a nós e receba nossas melhores histórias de tecnologia. Newsletter Newsletter por e-mail