Recursos/White Papers

Tecnologia

8 habilidades essenciais para cientistas de dados de alto desempenho

Extrair o verdadeiro valor comercial dos dados requer uma combinação única de habilidades técnicas, conhecimento matemático, narração de histórias e intuição. Eis o que você deve procurar nos candidatos

Bob Violino, CIO/EUA

Publicada em 28 de março de 2018 às 06h49

Os cientistas de dados continuam em alta demanda, com empresas de praticamente todos os setores buscando obter o máximo valor de seus recursos de informação em expansão.

"À medida que as organizações começam a aproveitar totalmente o uso de seus ativos de dados internos e examinar a integração com as centenas de fontes de dados de terceiros, a função do cientista de dados crescerá em relevância", afirma Greg Boyd, diretor da consultoria Protiviti

“No passado, as equipes responsáveis ​​pelos dados eram relegadas aos bastidores da organização de TI, executando as tarefas críticas do banco de dados para manter os vários sistemas corporativos alimentados com o 'combustível' de dados que permitia aos executivos corporativos reportar atividades operacionais e entregar resultados financeiros ”, diz Boyd.

Esse papel é importante, mas as estrelas em ascensão para os negócios são aqueles cientistas de dados experientes que têm a capacidade de não apenas manipular grandes quantidades de dados com sofisticadas técnicas estatísticas e de visualização, mas também uma perspicácia para obter informações prospectivas a partir da análise dessa massa de dados, diz Boyd. Essas informações ajudam a prever possíveis resultados e a mitigar ameaças potenciais aos negócios.

Então, o que é preciso para ser um especialista em Ciência de Dados? Aqui estão alguns atributos e habilidades importantes, de acordo com líderes de TI, analistas do setor, cientistas de dados e outros.

1 - Pensamento crítico

Os cientistas de dados precisam ser pensadores críticos, para poderem aplicar análises objetivas de fatos sobre um determinado tópico ou problema antes de formular opiniões ou fazer julgamentos.

"Eles precisam entender o problema ou a decisão do negócio e ser capazes de 'modelar' ou 'abstrair' o que é crítico para resolver o problema, versus o que é estranho e pode ser ignorado", diz Anand Rao, líder em dados e análises na empresa de consultoria PwC. "Esta habilidade, mais do que qualquer outra coisa, determina o sucesso de um cientista de dados", diz Rao.

Um cientista de dados precisa ter experiência, mas também a capacidade de afastar suas crenças pessoais, acrescenta Jeffry Nimeroff, CIO da Zeta Global, que fornece uma plataforma de marketing baseada na nuvem.

“Esse traço captura a ideia de saber o que esperar quando se trabalha em qualquer área, mas também saber que a experiência e a intuição são imperfeitas”, diz Nimeroff. “A experiência fornece benefícios, mas não é isenta de riscos se nos tornarmos muito complacentes. É aqui que o distanciamento das crenças pessoais é importante ”.

Não se trata de olhar para as coisas com os olhos arregalados de um novato, diz Nimeroff, mas sim dar um passo atrás e ser capaz de avaliar um problema ou situação de múltiplos pontos de vista.

2 - Codificação

Cientistas de dados de alto nível sabem escrever código e estão confortáveis ​​em lidar com uma variedade de tarefas de programação.

"A linguagem de escolha em ciência de dados está se movendo em direção a Python, com um acompanhamento substancial para R também", diz Rao. Além disso, existem várias outras linguagens em uso, como Scala, Clojure, Java e Octave.

“Para ser realmente bem-sucedida como cientista de dados, as habilidades de programação precisam incluir aspectos computacionais - lidar com grandes volumes de dados, trabalhar com dados em tempo real, computação em nuvem, dados não estruturados, além de aspectos estatísticos - [e] com modelos estatísticos como regressão, otimização, clustering, árvores de decisão etc. ”, diz Rao.

O impacto do Big Data a partir do final da década de 1990 exigiu que mais e mais cientistas de dados entendessem e pudessem codificar em linguagens como Python, C ++ ou Java, diz Celeste Fralick, cientista chefe de dados da McAfee.

Se um cientista de dados não entender como codificar, isso ajuda a ser cercado por pessoas que o fazem. “Agrupar um desenvolvedor com um cientista de dados pode ser muito proveitoso”, diz Fralick.

3 - Matemática

A ciência de dados provavelmente não é uma boa escolha de carreira para pessoas que não gostam ou não são proficientes em Matemática.

“Em nosso trabalho com organizações globais, nos envolvemos com clientes que buscam desenvolver modelos financeiros ou operacionais complexos”, afirma Boyd. “Para que esses modelos sejam estatisticamente relevantes, grandes volumes de dados são necessários. O papel do cientista de dados é alavancar sua profunda especialização em matemática para desenvolver modelos estatísticos que podem ser usados ​​para desenvolver ou mudar as principais estratégias de negócios ”.

O cientista de dados, especialista em matemática e estatística, tem a capacidade de colaborar estreitamente com executivos de linha de negócios para comunicar o que realmente está acontecendo na “caixa preta” de equações complexas de uma maneira que forneça garantias de que a empresa pode confiar nos resultados e recomendações, diz Boyd.

4 - IA, Machine Learning e Deep Learning

As indústrias estão se movendo extremamente rápido nessas áreas por causa do aumento da capacidade computacional, da conectividade e dos enormes volumes de dados coletados, diz Fralick. "Um cientista de dados precisa ficar à frente da curva na pesquisa, bem como entender qual  tecnologia aplicar e quando", diz ela. "Muitas vezes um cientista de dados aplicará algo 'sexy' e novo, quando o problema real que está resolvendo requer técnicas bem menos complexas".

Os cientistas de dados precisam ter uma compreensão profunda do problema a ser resolvido, e os dados em si vão falar sobre o que é necessário, diz Fralick. “Estar ciente do custo computacional para o ecossistema, latência, largura de banda e outras condições de fronteira do sistema - bem como a maturidade do cliente - ajuda o cientista de dados a entender a tecnologia a ser aplicada”, diz ela. Isso é verdade, desde que eles entendam as tecnologias disponíveis.

Também valiosas são habilidades estatísticas. A maioria dos empregadores não considera essas habilidades, diz Fralick, porque as ferramentas automatizadas de hoje e o software de código aberto estão prontamente disponíveis. "No entanto, entender as estatísticas é uma competência crítica para compreender as suposições que essas ferramentas e softwares fazem", diz ela.

Não basta entender as interfaces funcionais para os algoritmos de Machine Learning, diz Trevor Schulze, CIO da Micron Technology. “Para selecionar o algoritmo apropriado para o trabalho, um cientista de dados de sucesso precisa entender as estatísticas dentro dos métodos e as técnicas adequadas de preparação de dados para maximizar o desempenho geral de qualquer modelo”, diz ele.

Habilidades em Ciência da Computação também são importantes, diz Schulze. Como a ciência de dados é feita principalmente no teclado, os princípios fundamentais da engenharia de software são úteis.

datascience

5 - Comunicação

A importância das habilidades de comunicação é repetitiva. Praticamente nada na tecnologia hoje é realizado sem que haja alguma integração entre sistemas, aplicativos, dados e pessoas. A ciência de dados não é diferente, e ser capaz de se comunicar com várias partes interessadas usando dados é um atributo fundamental.

"A capacidade de 'contar histórias' através de dados traduz o que é um resultado matemático em uma visão ou intervenção acionável", diz Rao. “Estando na interseção de negócios, tecnologia e dados. Os cientistas de dados precisam ser hábeis em contar uma história para cada um dos interessados”.

Isso inclui a comunicação sobre os benefícios comerciais dos dados para os executivos de negócios; sobre tecnologia e recursos computacionais; sobre os desafios com qualidade de dados, privacidade e confidencialidade; e sobre outras áreas de interesse para a organização.

Ser um bom comunicador inclui a capacidade de destilar informações técnicas desafiadoras de forma completa, precisa e fácil de apresentar, diz Nimeroff. “Um cientista de dados deve lembrar que sua execução produz resultados que podem e serão usados ​​para apoiar as decisões da direção da empresa”, diz ele. “Assim, ser capaz de garantir que o público compreenda e aprecie tudo o que está sendo apresentado - incluindo o problema, os dados, os critérios de sucesso e os resultados - é fundamental”.

Um bom cientista de dados deve ter o conhecimento e a curiosidade do negócio para entrevistar adequadamente as partes interessadas do negócio para entender o problema e identificar quais dados provavelmente serão relevantes, diz Schulze.

Além disso, os cientistas de dados precisam ser capazes de explicar os algoritmos aos líderes de negócios. "A comunicação de como um algoritmo chegou a uma previsão é uma habilidade fundamental para ganhar a confiança dos líderes em modelos preditivos que fazem parte de seus processos de negócios", diz Schulze.

6 - Arquitetura de dados

É imperativo que o cientista de dados entenda o que está acontecendo com os dados desde o início para modelar a decisão de negócios.

“Não entender a arquitetura pode ter um impacto sério nas inferências e suposições do tamanho da amostra, muitas vezes levando a resultados e decisões incorretos”, diz Fralick.

Pior ainda, as coisas podem mudar dentro da arquitetura. Sem entender seu impacto nos modelos, para começar, um cientista de dados pode acabar “em uma tempestade de modelos refinados ou repentinamente imprecisos sem entender o porquê”, diz Fralick.

7 - Análise de riscos, melhoria de processos, engenharia de sistemas

Um cientista de dados preciso necessita entender os conceitos de análise de risco de negócios, melhorias nos processos e como a engenharia de sistemas funciona.

“Não conheço nenhum cientista de dados de excelente que não tenha essas habilidades”, diz Fralick. “Elas andam de mãos dadas, voltadss para o cientista de dados mas, externamente, também para o cliente.”

Internamente, o cientista de dados deve lembrar a segunda metade do título - cientista - e seguir uma boa teoria científica, diz Fralick.

Construir análises de risco no início do desenvolvimento do modelo pode mitigar os riscos. "Essas são todas as habilidades que os cientistas de dados precisam para investigar o cliente sobre o problema que está tentando resolver", diz ela.

Conectar os gastos para melhorar o processo, compreender os riscos inerentes da empresa e outros sistemas que podem impactar os dados ou o resultado de um modelo pode levar a uma maior satisfação do cliente com os esforços do cientista de dados, diz Fralick.

8 - Resolução de problemas e intuição de bons negócios

Em geral, os traços que os grandes cientistas de dados exibem são os mesmos traços exibidos por qualquer bom solucionador de problemas, diz Nimeroff. “Eles olham para o mundo a partir de muitas perspectivas, eles procuram entender o que devem fazer antes de tirar todas as ferramentas do cinto de ferramentas, trabalham de maneira rigorosa e completa, e podem explicar suavemente os resultados de seus produtos. execução ", diz Nimeroff.

Ao avaliar profissionais de tecnologia para papéis como cientistas de dados, Nimeroff procura esses traços. "A abordagem gera muito mais sucessos do que falhas e também garante que o potencial de crescimento seja maximizado, porque o pensamento crítico é trazido para a frente."

Encontrar um grande cientista de dados envolve encontrar alguém que tenha um conjunto de habilidades um tanto contraditório: inteligência para lidar com o processamento de dados e a criação de modelos úteis; e uma compreensão intuitiva do problema comercial a ser resolvido, a estrutura e as nuances dos dados, e como os modelos funcionam, diz Lee Barnes, chefe da Paytronix Data Insights na Paytronix Systems.

“O primeiro deles é o mais fácil de encontrar; a maioria das pessoas com boas habilidades em Matemática e Estatística, Engenharia ou outras disciplinas científicas provavelmente terá a força intelectual necessária para fazê-lo, diz Barnes. “O segundo é muito mais difícil de encontrar. É surpreendente quantas pessoas entrevistamos que construíram modelos complexos, mas quando pressionadas sobre o motivo pelo qual acham que o modelo funcionou ou por que escolheram a abordagem adotada não têm uma boa resposta ”.

É provável que essas pessoas sejam capazes de explicar a precisão do modelo, “mas sem entender por que e como funciona, é difícil ter muita confiança em seus modelos”, diz Barnes. “Alguém com essa compreensão e intuição mais profundas sobre o que está fazendo é um verdadeiro especialista em ciência de dados e provavelmente terá uma carreira de sucesso nesse campo.”



Reportagens mais lidas

Acesse a comunidade da CIO

LinkedIn
A partir da comunidade no LinkedIn, a CIO promove a troca de informações entre os líderes de TI. Acesse aqui