Home > Carreira

Era do cidadão Cientista de Dados chegou e o que isso mudará para você?

Ferramentas de software estão capacitando analistas de negócios a gerar modelos analíticos e insights sem a ajuda de engenheiros de software

Clint Boulton, CIO (EUA)

30/10/2019 às 8h24

Foto: Shutterstock

Os cientistas de dados custam caro, apresentando um desafio para qualquer empresa que não seja o Google, Facebook, Amazon ou Apple. Os CIOs que tiveram a sorte de tirá-los de grandes organizações de tecnologia ou atraí-los diretamente da faculdade ficam orgulhosos enquanto falam sobre todas as ideias de negócios que terão com os seus gurus de dados.

A IBM espera que a demanda por cientistas de dados suba 28% até 2020 - e esse número pode ser ainda maior. Para lidar com a escassez de talentos, as empresas estão desenvolvendo softwares que fazem esse trabalho, criando efetivamente cientistas de dados a partir de funcionários corporativos que não fazem parte da equipe de TI.

De acordo com o Gartner, a ciência de dados por software inclui recursos e práticas que permitem aos usuários extrair informações preditivas e prescritivas dos dados enquanto trabalham em posições fora dos campos de estatística e análise. Esses cientistas de dados são "usuários avançados", como analistas de negócios que não têm formação em ciência da computação, mas podem executar tarefas analíticas simples a moderadamente sofisticadas que anteriormente exigiam mais conhecimento. Essa tem sido uma maneira útil de lidar com a escassez de talentos.

"O aumento da disponibilidade de ferramentas, tecnologia, dados e modelos está permitindo a disseminação de insights para pessoas que normalmente não teriam capacidade de se dar bem", diz Brandon Purcell, analista da Forrester Research.

A ciência dos dados foi democratizada para (quase) todos

A tecnologia sempre encontra uma maneira de democratizar o acesso à informação. Então o que mudou? No modelo tradicional - ainda praticado pela maioria das empresas - os analistas de negócios ficam meses com alguém de TI e um cientista de dados para planejar modelos com o objetivo de gerar insights preditivos, com o especialista em data science construindo o modelo do zero.

Agora, graças a ferramentas como o SPSS e o Alteryx da IBM, novos cientistas de dados (conhecidos como Cidadão de Ciência de Dados), muitos com pouca ou nenhuma experiência em codificação, utilizam softwares para obter insights. Essas plataformas tornam "muito mais fácil para os analistas de linha de negócios manipular dados do que no Excel", afirma Purcell.

A General Motors, por exemplo, criou o Maxis, uma plataforma de análise que permite aos usuários realizar consultas do tipo Google para obter previsões de vendas e métricas operacionais, como desempenho da cadeia de suprimentos. A GM pode ser uma exceção agora, mas muitas empresas optarão pela mesma abordagem em pouco tempo, concordam os especialistas.

A ciência de dados é um foco fundamental da gigante petrolífera Shell, onde os funcionários analisam os petabytes de dados da empresa para gerar insights operacionais e de negócios. Graças ao software de autoatendimento, os funcionários que, de outra forma, talvez não pudessem usar a análise, agora podem desfrutar das informações sem ajuda técnica. Por exemplo, a Shell usa o software de autoatendimento da Alteryx para ajudar a executar modelos preditivos que antecipam quando peças da máquina de perfuração de petróleo poderão apresentar falhas.

"As ferramentas de ciência de dados estão democratizando a ciência de dados, para que mais pessoas possam fazer o trabalho", declara Daniel Jeavons, gerente geral do centro de excelência em ciência de dados da Shell. Por outro lado, a Shell utiliza "mecanismos poderosos", como o Google TensorFlow e a biblioteca de deep learning MXNet, além das linguagens de programação Python e R. "Sempre haverá um espectro que abrange o cientista de dados não especializado e o cientista de dados profissional, e temos que apoiar os dois."

CIO2503

E-book por:

O Cidadão de Ciência de Dados, preenche a lacuna entre a análise realizada por usuários de negócios e a análise avançada atribuída aos cientistas de dados. Já os cientistas de dados profissionais criam e escalam modelos e algoritmos em toda a empresa.

Convencidas pela máxima já amplamente aceita de que os dados são o novo petróleo, muitas empresas ficaram "seduzidas pelo glamour de análises complexas", observa Joe DosSantos, vice-presidente sênior de informações corporativas do TD Bank Group.

O TD Bank usa uma ampla gama de ferramentas analíticas básicas e sofisticadas para melhor alinhar os dados históricos e atuais dos clientes, bem como para conduzir análises de fraude. Por exemplo, o banco usa o software da AtScale para ajudar os usuários de negócios a consultar dados em tempo real do banco de dados Hadoop e obter resultados rápidos. Os analistas do TD Bank visualizam as informações no sistema de autoatendimento Tableau.

Cientistas de dados ainda são desejados

Outros fornecedores de software estão acelerando a tendência da democratização de dados, geralmente empregando recursos de aprendizado de máquina (ML) e inteligência artificial (IA) para criar modelos automatizados.

A Salesforce, por exemplo, oferece o Einstein Prediction Builder, que permite aos analistas de negócios criar modelos de IA personalizados, adicionando variáveis ​​para prever resultados. O Sensei da Adobe, outra ferramenta de software de ML, ajuda os profissionais de marketing a criar campanhas em minutos, economizando horas de trabalho.

Mais de 40% das tarefas de ciência de dados provavelmente serão automatizadas até 2020, diz o Gartner. Para Purcell, essa abordagem automatizada de ML "será a próxima geração da ciência de dados".

Obviamente, nem todo desafio de big data será facilmente enfrentado por um Cidadão Cientista de Dados. As empresas ainda precisam de estatísticos e outros especialistas versados ​​em técnicas matemáticas avançadas, revela Bill Roberts, da Deloitte Consulting.

Além disso, Roberts observa que, embora as ferramentas de autoatendimento possam servir bem a uma empresa, se elas não funcionarem corretamente poderão gerar problemas para a organização. Se algo der errado, talvez haja um problema com o próprio algoritmo. "Quando há um problema, você precisa de alguém com algum treinamento ou grau avançado que possa resolver isso", conclui.

 

Junte-se a nós e receba nossas melhores histórias de tecnologia. Newsletter Newsletter por e-mail