Recursos/White Papers

Tecnologia

Por que e como sua empresa deve investir em Ciência de Dados

A Ciência de Dados é uma área em evolução e há muitas maneiras de usá-la. Confira tudo o que você precisa saber para começar e três opções de cursos online com desconto

Da Redação, com Thor Olavsrud (CIO/EUA)

Publicada em 04 de julho de 2018 às 08h33

Trabalhar com Ciência de Dados requer uma abordagem alternativa ao negócio em que a lógica se sobrepõe à criatividade e a realidade supera a crença. Em outras palavras, depende de fato e lógica, em vez de imaginar o que poderia ser possível.

A Ciência de Dados é um método para coletar insights de dados estruturados e não estruturados usando abordagens que vão desde a análise estatística até o Machine Learning. Para a maior parte das organizações, a Ciência de Dados é empregada para transformar dados em valor, transformando-os em receita aprimorada, custos reduzidos, agilidade nos negócios, melhor experiência do cliente, desenvolvimento de novos produtos, entre outros.

"A quantidade de dados que a empresa pode pegar é imensa, mas se não estiver fazendo nada com isso, transformando-o em algo interessante, não adianta. A Ciência de Dados significa dar a esses dados um propósito", diz Adam Hunt, cientista chefe de dados da RiskIQ.

Ciência de dados vs Analytics
A análise de dados é geralmente vista como um componente da Ciência de Dados, usada para entender como são os dados de uma organização. A Ciência de Dados usa Analytics para resolver problemas.

"A Ciência de Dados está chegando a conclusões que levam os dados adiante. Se a pessoa não está resolvendo um problema com dados, está apenas fazendo uma investigação, isso é apenas uma análise. A Ciência de Dados tem mais a ver com a resolução de problemas do que com Analytics, o exame e a plotagem de dados", diz Hunt.

Ciência de dados vs Big Data
A Ciência de Dados e o Big Data geralmente são vistos como conceitos conectados, mas os cientistas de dados não trabalham apenas com big data. A Ciência de Dados pode ser usada para extrair valor de dados de todos os tamanhos, sejam eles estruturados, não estruturados ou semi estruturados.

Big Data é útil para as equipes de Ciência de Dados em muitos casos, porque quanto mais dados estiver disponíveis, mais parâmetros serão incluídos em um determinado modelo. "Big data ajuda em certos aspectos, mas nem sempre é melhor. Por exemplo, o mercado de ações não funciona em uma linha, então não vai funcionar”, comenta o executivo.

Valor comercial da ciência de dados
O valor comercial da Ciência de Dados depende da organização que a está usando. Ela pode ajudar a criar ferramentas para prever falhas de hardware, permitindo que a empresa realize a manutenção preditiva e evite o tempo de inatividade. Pode ser usada para prever o que colocar nas prateleiras dos supermercados, ou quão popular um produto será baseado em seus atributos.

"O maior valor que uma equipe de Ciência de Dados pode ter é ser incorporados às equipes de negócio. Uma pessoa inovadora vai encontrar valor que outras pessoas não esperavam", diz Ted Dunning, arquiteto chefe de aplicações da MapR Technologies.

Ferramentas de Ciência de Dados
As equipes fazem uso de uma ampla gama de ferramentas, incluindo SQL, Python, R, Java e uma infinidade de projetos de código aberto, como Hive, Oozie e TensorFlow. Essas ferramentas são usadas para tarefas relacionadas a dados, desde extrair e limpar dados, até submeter dados a análises algorítmicas via métodos estatísticos ou Inteligência Artificial.

De acordo com Dunning, o cientista de dados precisa olhar criticamente para aspectos muito simples dos dados. "O profissional precisa de boas ferramentas de visualização e ferramentas de programação - o Python é um favorito das probabilidades neste momento. São necessárias, também, ferramentas que realmente construirão modelos interessantes", diz Dunning.

cienciadedados

Habilidades em Ciência de Dados
A Ciência de Dados é uma área em evolução e há muitas maneiras de aprender sobre ela. Porém, ainda que o número de programas de graduação em Ciência de Dados esteja aumentando rapidamente, eles não são necessariamente o que as organizações procuram quando buscam cientistas de dados.

O Stange-Tregear, do eBates, diz que busca candidatos com histórico de Estatística, conhecimento do negócio para contextualizar resultados e habilidades de comunicação para apresentar os resultados a usuários corporativos.

"Dou preferência para PhDs, mas não deixaria de lado alguém que tem muita experiência", diz Hunt. "Um PhD é capaz de fazer uma pesquisa muito profunda sobre um tópico e é capaz de disseminar essa informação para os outros. Mas ter um sólido background ou projeto pessoal é incrivelmente interessante."

Hunt diz que ele, particularmente, procura por PhDs em Física, Matemática, Ciência da Computação, Economia ou Ciências Sociais. Ainda que não dispense candidatos com graduação em Ciência de Dados ou Analytics, ele tem reservas. "Minha experiência pessoal é que eles são muito úteis, mas se concentram demasiadamente nas operações dos modelos e não na mentalidade do processo".

Dunning se importa mais com a capacidade do candidato de mostrar algo novo. "O que mais levo em conta é se o entrevistado me ensinou alguma coisa. Não quero contratar pessoas que saibam como fazer o que eu também sei. Eu quero encontrar pessoas que possam fazer coisas que eu não posso fazer, ou que ensinem coisas para o time”, explica.

Para Dunning, alguns dos melhores cientistas de dados ou líderes em grupos de Ciência de Dados têm origens não tradicionais. Ele cita, por exemplo, algumas pessoas que já passaram pela empresa e trabalharam como jardineiro antes de ir para a faculdade, tinham um diploma de literatura francesa ou de jornalismo, com pouco treinamento formal em informática.

Analistas e cientistas de dados são as profissões quentes agora, dado o valor que eles podem entregar para as empresas – especialmente aquelas que estão guardando os grandes volumes de informação digital que estão sendo reunidas a cada minuto.

No entanto, não há profissionais suficientes para preencher todas as posições abertas e isso significa que oportunidades de descobrir novos insights estão sendo perdidas enquanto as empresas se esforçam para preencher esses papéis cruciais.

O principal desafio é que os cientistas de dados têm um conjunto de habilidades muito específico: uma experiência nascida de educação, tempo, experiência e capacidade técnica. Qualquer outro que falte um ou dois aspectos desse conjunto não consegue preencher todos os requisitos que as empresas anseiam.

Mesmo que os avanços da tecnologia ajudem a fazer o que costumava estar na seara de Ph.D’s, ainda há muitas vagas abertas que necessitam de qualidades como perícia na análise de dados, uma tendência que não mostra sinais de reversão a curto prazo.

Cada indústria tem seu próprio grande perfil de profissional de análise de dados. Aqui estão algumas das formas mais comuns em cada indústria, bem como os tipos de análise que o cientista de dados provavelmente será obrigado a realizar.

- Negócios - Hoje, os dados moldam a estratégia de negócios para quase todas as empresas - mas as empresas precisam de cientistas de dados para darem sentido às informações derivadas de dados. A análise de dados empresariais pode definir a tomada de decisão orientada por eficiência, inventário,  fidelização de clientes e muito mais.

- E-commerce - Os sites colecionam mais do que dados de compras e, por isso, cientistas de dados ajudam os negócios de comércio eletrônico a melhorar o atendimento ao cliente, encontrar tendências e desenvolver serviços ou produtos.

- Finanças - No setor financeiro, os dados sobre contas, transações de crédito e débito e dados financeiros similares são vitais para o funcionamento do  negócio. Mas para cientistas de dados neste campo, segurança e conformidade, incluindo detecção de fraude, também estão entre as preocupações principais.

- Governo - O Big Data ajuda os governos a tomar decisões, a apoiar os congressistas e a monitorar a satisfação geral. Como no setor financeiro, a segurança e a conformidade são uma preocupação primordial.

- Ciência - Os cientistas sempre manipularam dados, mas agora, com tecnologia, eles podem melhorar a coleta, compartilhamento e a análise de dados de experiências. Os cientistas de dados podem ajudar com esse processo.

- Redes sociai - Os dados de redes sociais ajudam a divulgar publicidade segmentada, melhorar a satisfação do cliente, estabelecer tendências em dados de localização e aprimorar recursos e serviços. A análise contínua de dados de postagens, tweets, blogs e outras mídias sociais pode ajudar as empresas a melhorar constantemente seus serviços.

- Saúde -  Os registros médicos eletrônicos são agora o padrão nas instalações de saúde, o que exige uma dedicação em relação a Big Data, segurança e conformidade. Aqui, os cientistas de dados podem ajudar a melhorar os serviços de saúde e descobrir tendências que podem passar despercebidas de outra forma.

- Telecomunicações - Todos os produtos eletrônicos coletam dados e todos esses dados precisam ser armazenados, gerenciados, mantidos e analisados. Cientistas de dados ajudam as empresas a espreitar insetos, melhorar produtos e manter os clientes satisfeitos através da entrega dos recursos que desejam.

Habilidades
De acordo com William Chen, Gerente de Ciência de Dados da Quora, as cinco principais habilidades para cientistas de dados incluem uma mistura de habilidades técnicas e suaves:

- Programação: Chen cita programação como o "mais fundamental do conjunto de habilidades de um cientista de dados", observando que agrega valor às habilidades do profissional. A programação melhora as habilidades estatísticas do profissional, ajuda a "analisar grandes conjuntos de dados" e oferece a capacidade de criação das próprias ferramentas.

- Análise quantitativa: Uma habilidade importante para analisar grandes conjuntos de dados, a análise quantitativa irá melhorar a capacidade do profissional de executar análises experimentais, dimensionar sua estratégia de dados e ajudá-lo a implementar Machine Learning.

- Intuição do produto: Compreender os produtos irá ajudar o profissional a realizar análises quantitativas, diz Chen. Também irá ajudá-lo a prever o comportamento do sistema, estabelecer métricas e melhorar as habilidades de depuração.

- Comunicação: Possivelmente as habilidades mais importantes em todos os setores, uma forte capacidade de comunicação irá ajudar o profissional a "aproveitar todas as habilidades anteriores listadas", diz Chen.

- Trabalho em equipe: Muito parecido com comunicação, o trabalho em equipe é vital para uma carreira bem sucedida em ciência dos dados. Ele exige que o profissional seja abnegado, seja receptivo a feedbacks e compartilhe seu conhecimento com sua equipe, diz Chen.

Educação e treinamento
Há muitas maneiras de um profissional se tornar um cientista de dados, mas a rota mais tradicional é obtendo um diploma de bacharel. A maioria dos cientistas de dados tem mestrado ou doutorado, mas existem outras formas de desenvolver habilidades para a profissão. Antes de optar por qualquer delas é preciso saber em que setor o profissional irá trabalhar para descobrir as habilidades, ferramentas e software mais importantes.

Como a Ciência dos Dados requer alguma experiência em domínio de negócios, o papel de um cientista de dados varia dependendo da indústria. Se for uma indústria altamente técnica, talvez seja necessário treinamento adicional. Por exemplo, se o profissional for trabalhar em saúde, governo ou ciência, precisará de uma habilidade diferente daqueles que atuarão em marketing, negócios ou educação.

Se você quiser desenvolver certos conjuntos de habilidades para atender às necessidades específicas da indústria, existem aulas on-line, campos de inicialização e cursos de desenvolvimento profissional que podem ajudar a aprimorar suas habilidades.

Se você precisa treinar a equipe para começar a trabalhar com Ciência de Dados, há alguns cursos online que podem ajudá-lo. A Udemy, marketplace de cursos online e uma das principais referências mundiais em educação à distância, conta com mais de 55 mil cursos e uma série deles dedicado ao ensino de linguagem de programação, com opções dedicadas exclusivamente a formação em data science.

A empresa do Vale do Silício e a IDG contam com um canal exclusivo de cursos para os leitores dos sites IDGNow!, Computerworld, Macworld, PC World e CIO. O canal oferece, a preços excepcionalmente reduzidos, milhares de cursos e preparações para certificações em tecnologia da informação e internet, em português. 

Na lista a seguir, separamos três cursos voltados para a formação de cientistas de dados e que saem apenas por apenas R$29,99.

1. Data Science de A a Z
Nesse curso voltado para iniciantes, você aprenderá lógica de programação, manipulação de arquivos, visualização de gráficos, entre outras etapas, usando a linguagem Python. Outros conteúdos incluem carga de dados com integration services e Análise em R e conceitos fundamentais de Estatística.

Com 95% de desconto, este curso sai por R$29,99 

2. Python para Data Science e Machine Learning
Este curso será seu guia para aprender a usar todo o poder do Python para analisar dados, criar excelentes visualizações e usar algoritmos de Machine Learning. O treinamento foi concebido para principiantes com alguma experiência de programação ou desenvolvedores experientes que procuram dar um salto em direção à ciência dos dados. Com mais de 100 aulas de vídeo e notebooks de códigos detalhados para cada palestra, este é um dos cursos mais abrangentes para ciência de dados e Machine Learning na Udemy.

Aproveite, este curso também sai por R$ 29,99

3. Curso completo de Banco de Dados e SQL
A boa notícia é que para realizar este curso não é necessário nenhum requisito. Todos os softwares, técnicas, instalações e infraestrutura do curso serão passados ao aluno desde o nível básico ao nível avançado.

O curso de Banco de Dados abrange do básico ao avançado, não somente a linguagem SQL como também tarefas de infraestrutura, inerentes a um DBA. Desde a base no banco MySQL para uma melhor compreensão, ao SQL Server, onde são ensinados aspectos básicos até o intermediário avançado como triggers e ccurspres, e finalmente para o Oracle, onde alunos aprenderão sobre os dois maiores bancos do mercado 

Este curso é outro que se encontra com 95% de desconto e sai por R$29,99



Reportagens mais lidas

Acesse a comunidade da CIO

LinkedIn
A partir da comunidade no LinkedIn, a CIO promove a troca de informações entre os líderes de TI. Acesse aqui