Home > Tendências

Por um código de conduta para os cientistas de dados

Deve-se cobrar de profissionais de Big Data altos níveis de padrões éticos, assim como se faz com médicos e advogados

Cindy Waxer, CIO/EUA

30/01/2015 às 8h21

Foto:

Mais do que simplesmente bits e bytes, Big Data é agora uma
oportunidade de negócio multibilionário. Organizações mais experientes,
dos varejistas aos fabricantes, estão rapidamente descobrindo o poder de
transformar em insights os códigos postais dos consumidores e seu
histórico de compras.
Na verdade, o McKinsey Global Institute, braço de pesquisa da McKinsey
& Co., estima que o Big Data possa aumentar os lucros no setor de
varejo em 60%. E estudo recente do Boston Consulting Group revela que os
dados pessoais podem ajudar as empresas a atingirem maior eficiência de
negócios e personalizar novos produtos.

Mas ao mesmo tempo que aproveitar o poder da análise de dados é
claramente uma vantagem competitiva, a mineração de dados com excesso de
zelo pode facilmente sair pela culatra. Com as empresas tornando-se
especialistas no fatiamento de dados para revelar detalhes tão pessoais
como a inadimplência das hipotecas e os riscos de ataque cardíaco, a
ameaça de violações de privacidade cresce.

Basta perguntar a Kord Davis, estrategista digital e autor de Ética
da Big Data: Risco de equilíbrio e Inovação. Segundo ele, "os valores
que você infundir em suas práticas de manipulação de dados pode ter
algumas consequências muito reais".

"As organizações que são transparentes sobre o seu uso de dados são
capaz de usar isso como uma vantagem competitiva", afirma Davis. "As
pessoas estão começando a se tornar muito interessadas no que pode
acontecer lá fora, com seus dados. Portanto, organizações éticas no
compartilhamento de informações estarão uma posição muito melhor par se
tornarem confiáveis."

Honestidade é realmente a melhor política

Profissionais de TI estão descobrindo que equilibrar o
poder de algoritmos sofisticados com os direitos do consumidor é mais do
que evitar a má publicidade ou a perda de vendas. Nos dias de hoje,
vale a pena ser honesto - literalmente.

Muitos CIOs e cientistas de dados já enfrentam o desafio de calcular o
valor real dos dados confidenciais e seus insights respeitando os
direitos dos consumidores e até mesmo procurando ganhar a sua confiança.
Como a disponibilidade de dados cresce, e as técnicas de manipulação se
multiplicam, alguns profissionais de TI estão tomando o assunto em
suas próprias mãos, com abordagens inovadoras para a prevenção de
abusos.

A empresa de análise de dados californiana Retention Science é um
exemplo perfeito. Usa algoritmos de previsão e dados, como renda
familiar, histórico de compras e pontuação de crédito para ajudar as
empresas a preverem a probabilidade de compra de um cliente e criarem
campanhas de retenção. Além dos dados fornecidos pelo cliente, a
Retention Science também conta com os dados que licencia de terceiros
para atingir os consumidores certos, no momento certo.

Para criar campanhas direcionadas respeitando a privacidade dos
consumidores a Retention Science estabeleceu regras rígidas e rápidas
que regem o uso de dados. Por um lado, a empresa se recusa a
compartilhar dados entre clientes. Por exemplo, se a Gap fosse cliente, e
tivesse fornecido dados de consumidores à Retention Science, essa
informação jamais seria compartilhada - mesmo anonimamente - com outros
clientes de varejo.

Além disso, apesar de lidar com terabytes de dados confidenciais, a
Retention Science obriga que todos os seus cientistas de dados, muitos
dos quais professores e pesquisadores, assinem acordos de
confidencialidade. "Eles não têm permissão para compartilhar ou usar os
dados em qualquer outro lugar ou para suas próprias publicações", diz
Jerry Jao, CEO da companhia.

Além de manter seus próprios funcionários responsáveis pela
confidencialidade dos dados, a Retention Science também "só trabalha com
empresas totalmente empenhadas em obter o consentimento dos
consumidores antes de usar seus dados", diz Jao. "Nós não queremos
incluir informações de indivíduos se eles não concederem no acesso a
elas em primeiro lugar."

Transparência também é importante

Embora a definição de controles internos ajude, as empresas
interessadas na mineração de dados podem dar um passo adiante,
oferecendo aos consumidores acesso em primeira mão sobre tudo o que
sabem sobre eles. A BlueKai, de Cupertino, também na Califórnia, é um
bom exemplo de política de livro aberto. Ela oferece uma plataforma de
gerenciamento de dados na qual comerciantes e editores podem gerenciar e
ativar dados para a construção de campanhas de marketing direcionadas.
Em 2008, a BlueKai decidiu lançar um portal online onde os consumidores
pudessem descobrir os cookies da BlueKai e de seus parceiros e os dados
recolhidos a partir deles, item por item, com base em seus históricos de
navegação.

Considere, por exemplo, uma mulher interessada em comprar uma
bicicleta vermelha. Como ela visita diferentes sites de artigos
esportivos que fazem parceria com BlueKai, uma coleção de cookies
anônimos são armazenados em seu browser. Com base nesse histórico de
navegação, parceiros de marketing da BlueKai exibem anúncios
comportamentais no computador da mulher, relevantes para sua busca pela
bicicleta vermelha ideal.

A BlueKai torna esse processo mais transparente, e ainda permite que
os visitantes optem por sair do registro totalmente ou por atualizar
seus perfis anônimos, alterando as suas preferencias.

De acordo com Omar Tawakol, CEO da BlueKai, o pensamento por trás
dessa prática da companhia é o de que, "se há dados conhecidos e
negociáveis, eles devem ser completamente controlados pelos
consumidores." Por esta razão, a BlueKai também incentiva seus parceiros
a promoverem uma maior transparência, adotando a prática em seus
próprios sites.

"A beleza do que fazemos é que não quero saber quem você é", diz
Tawakol. "Nós não queremos saber o nome de ninguém. Nós não queremos
saber nada reconhecível sobre o consumidor. Tudo o que queremos é
mostrar a ele que os cookies são acessíveis, e têm atributos associados a
eles."

A BlueKai não é o único grande player do mercado de análise de dados a
distribuir passes para os bastidores. O marketing da empresa de
tecnologia Acxiom ganhou as manchetes recentemente ao lançar o
AboutTheData.com, um site gratuito onde as pessoas podem ver algumas das
informações que a empresa reúne sobre elas. Detalhes variam do estado
civil ao tipo de veículo que elas dirigem. Basta digitar informações
pessoais chave para descobrir o que os anunciantes estão usando para
ajudar a adequar as suas mensagens de marketing.

O fato de que poderosos corretores de dados, como a Acxiom, estejam
ajudando a desmistificar as iniciativas de marketing baseadas em dados
não é nenhuma surpresa para Tawakol, CEO da BlueKai. Ele acredita que as
empresas não têm escolha, a não ser responder positivamente às mudanças
sentimento do consumidor em torno de privacidade de dados. "Anos atrás,
as pessoas construíram empresas de dados nas sombras onde os
consumidores não tinham qualquer controle", diz ele. "Estamos em uma era
diferente agora - os consumidores querem e devem estar no controle."

Mas na opinião de Kord Davis, o movimento em direção a uma maior
transparência é cínico. Observando que "as organizações estão começando a
enfrentar um escrutínio cada vez mais rigoroso em torno de suas
práticas de dados", Davis alerta que muitas iniciativas que prometem às
pessoas uma visão sobre como estão sendo monitoradas não passam de
jogadas de marketing. "Eles não revelam, de fato, quem está comprando
esses dados e o que estão fazendo com ele", argumenta o estrategistas.

Políticas de uso sob ataque

Infelizmente, a maior transparência nem sempre se traduz em
uma maior compreensão. As políticas de privacidade dos titãs da
indústria, tais como Facebook e Google têm estado sob fogo cerrado, por
serem de difícil compreensão. Apresentadas como um tratado de 70 páginas
cheias de termos vagos como "informações não pessoalmente
identificáveis," algumas políticas têm provocado arrepios nos
reguladores norte-americanos.

"As pessoas não entendem o que estão aceitando", diz Davis. "As
organizações tornam os termos de uso muito mais complicados do que
deveriam ser." Além disso, acrescenta, "ler todos os termos de serviços
que recebemos levaria 76 dias do ano."

Isso não significa que as políticas de privacidade não tenham valor
no mundo do Big Data. Apenas que as empresas precisam "comunicar melhor o
valor que os consumidores receberão em troca das informações que
entregam".

Em uma recente pesquisa global, realizada pela Infosys, 39% dos
entrevistados disseram que consideram que a mineração de dados invasiva.
E 72% disseram que não sentem que as promoções online ou e-mails que
recebam estejam diretamente relacionados aos seus interesses e
necessidades pessoais. No entanto, segundo Nans Sivaram, da Infosys, "os
consumidores estão dispostos a fornecer informações pessoais, desde que
haja boa razão para isso."

Por um lado, os consumidores querem receber produtos e serviços
altamente direcionados e personalizado. Por outro lado, não querem
sentir que seus dados pessoais estejam sendo usados para gerar lucro.

"Os varejistas precisam fazer um trabalho muito melhor de uso dos
dados que já possuem para atingir seus clientes", diz Sivaram. "Têm que
ter cuidado para que esse uso não seja visto como invasivo, para não
terem problemas e perderem a confiança de seus clientes."
Então, qual é a solução? De acordo com Sivaram, a resposta é
"estabelecer os incentivos corretos" para que as pessoas concordem em
divulgar seus dados pessoais.

A mesma regra de reciprocidade se aplica ao conteúdo online. Diz
Tawakol, da BlueKai: "Quando você pergunta se as pessoas preferem pagar
por seu conteúdo ou terem anúncios direcionados ao lado desse conteúdo,
geralmente 90% das pessoas preferem ter conteúdo patrocinado. "

A definição de um código de conduta

No entanto, nem todos acreditam que a carga deve ser
colocada sobre o consumidor. Não de trata apenas de fazê-lo concordar
alegremente em compartilhar seus dados, decifrar as confusas políticas
de privacidade ou pontuações de crédito para a troca de cupons de
supermercado. Na opinião de Michael Walker, os profissionais Big Data
devem adotar um código de ética. Sócio-gerente da Rosa Business
Technologies, integradora de sistemas com base em Denver, Walker
elaborou um código de conduta para os profissionais de Big Data que
cobre tudo, desde o papel dos cientistas de dados até suas
responsabilidades diárias.

De acordo com Michael Walker, deve-se cobrar dos cientistas de dados altos níveis de padrões éticos, assim como se faz com médicos e advogados. Para esse fim ele criou um conjunto de mandamentos para os trituradores
de dados – uma lista que tem como objetivo manter os cientistas de dados na
conduta correta enquanto preserva a privacidade do consumidor.

Na visão de Walker, os cientistas de dados não devem:

1. Falhar em utilizar métodos científicos no desempenho da ciência de dados.

2. Falhar em classificar a qualidade da evidência de uma maneira razoável e
compreensível para o cliente.

3. Alegar que evidências fracas ou incertas sejam evidências fortes.

4. Fazer mau uso de evidências fracas ou incertas para comunicar uma realidade
falsa ou promover uma ilusão de compreensão.

5. Falhar em classificar a qualidade dos dados de modo razoável e compreensível
para o cliente.

6. Alegar que dados ruins ou incertos são dados bons.

7. Fazer mau uso de dados de qualidade ruim ou incerta para comunicar uma
realidade falsa ou promover uma ilusão de compreensão.

8. Falhar em divulgar tudo e todos os resultados de ciência de dados ou envolver-
se no ocultamento de evidências.

9. Falhar em tentar replicar os resultados da ciência de dados.

10. Falhar em divulgar que tais resultados de ciência de dados não puderam ser
replicados.

11. Fazer mal uso dos resultados da ciência de dados para comunicar uma
realidade falsa ou promover uma ilusão de compreensão.

12. Falhar em divulgar experimentos fracassados ou evidências refutativas
familiares ao cientista de dados para ser diretamente adverso à posição do
cliente.

13. Oferecer evidência que o cientista de dados sabe ser falsa.

Caso um cientista de dados questione a qualidade dos dados ou evidência, ele
deve divulgar isto para o cliente. Caso um cientista tenha oferecido evidência
material e depois descubra que a mesma é falsa, ele deve tomar as medidas
corretivas razoáveis, incluindo a divulgação para o cliente. Um cientista de dados
deve divulgar e rotular as evidências que ele acredita razoavelmente serem
falsas.

"As empresas estão começando a entender o perigo de utilizações
secundárias de informação e dos abusos com os dados pessoais das
pessoas", diz Walker. "Uma vez que elas começam a pensar sobre isso,
passam a ser muito favoráveis à adoção de um código de ética."

De fato, em uma pesquisa de agosto de 2013, conduzida pela Revolution
Analytics, 80% dos entrevistados disseram concordar com a existência de
um quadro ético para coleta e uso de dados. E mais da metade dos
cientistas de dados pesquisados concordaram que a ética já desempenha um
papel importante em suas pesquisas.

"A minha solução é ter algum tipo de código de conduta profissional
que os cientistas de dados concordem voluntariamente a seguir para
proteger os dados confidenciais das pessoas", diz Walker. Só através da
criação de uma espécie de Juramento de Hipócrates para profissionais de
análises de dados, Walker acredita que os cientistas de dados venham a
ter as bases morais e legais para se recusarem a usar dados de maneiras
que ameacem violar os direitos de privacidade dos consumidores.

Walker não é o primeiro a conceber um código de ética para os
analistas. No início deste ano, o Institute for Operations Research and
the Management Sciences (INFORMS) elaborou um código de ética para
acompanhar o lançamento do seu programa de certificação Certified
Professional Analytics (CAP).

No entanto, Davis acredita que apesar das nobres intenções nobres, é
muito fácil deixar de cumprir um código de ética” escrito em um pedaço
de papel e esquecido no fundo de uma gaveta". O desafio, diz ele, "é
compreender o que você realmente faz com dados e alinhar com os valores
compartilhados na organização." Infelizmente, diz ele, determinar os
reais valores de uma organização, e se as suas práticas de dados
refletem ou não essas prioridades, é uma conversa muito diferente da que
estamos acostumados a ver em um ambiente “empresarial."

Há ainda profissionais de TI que sustentem a tese de que a proteção
da privacidade simplesmente não é trabalho de um cientista de dados. “O
trabalho deles é extrair insights interessantes a partir dos dados", diz
Ryan Kalember, diretor de produto da WatchDox, fornecedora de
ferramentas de segurança de Palo Alto, na Califórnia.

Mercado irá conduzir respostas

Na opinião de Tawakol, as mudanças na consciência do consumidor
sobre a privacidade de dados (ou a falta dela) têm muito mais chance de
estimular reformas nas práticas de coleta de dados do que as
legislações. Empresas que continuarem insistindo em não serem
transparentes serão ultrapassadas.

"Há muitas vantagens em ter os dados analisados e empresas adaptando
produtos e serviços específicos para as preferências dos clientes. Mas é
realmente interesse das empresas respeitarem os dados privados das
pessoas?", pergunta ele.

Junte-se a nós e receba nossas melhores histórias de tecnologia. Newsletter Newsletter por e-mail