Home > Tendências

Por que e como sua empresa deve investir em Ciência de Dados

A Ciência de Dados é uma área em evolução e há muitas maneiras de usá-la. Confira tudo o que você precisa saber para começar e três opções de cursos online com desconto

Da Redação, com Thor Olavsrud (CIO/EUA)

04/07/2018 às 7h43

cienciadedados_310012835.jpg
Foto:

Trabalhar com Ciência de Dados requer uma abordagem alternativa ao negócio
em que a lógica se sobrepõe à criatividade e a realidade supera a crença. Em
outras palavras, depende de fato e lógica, em vez de imaginar o que poderia ser
possível.

A Ciência de Dados é um método para coletar insights
de dados estruturados e não estruturados usando abordagens que vão
desde a análise estatística até o Machine Learning. Para a maior parte
das organizações, a Ciência de Dados é empregada para transformar dados
em valor, transformando-os em receita aprimorada, custos reduzidos,
agilidade nos negócios, melhor experiência do cliente, desenvolvimento
de novos produtos, entre outros.

"A quantidade de dados que a
empresa pode pegar é imensa, mas se não estiver fazendo nada com isso,
transformando-o em algo interessante, não adianta. A Ciência de Dados
significa dar a esses dados um propósito", diz Adam Hunt, cientista
chefe de dados da RiskIQ.

Ciência de dados vs Analytics
A
análise de dados é geralmente vista como um componente da Ciência de Dados, usada para entender como são os dados de uma organização. A Ciência de Dados usa Analytics para resolver problemas.

"A Ciência
de Dados está chegando a conclusões que levam os dados adiante. Se a
pessoa não está resolvendo um problema com dados, está apenas fazendo
uma investigação, isso é apenas uma análise. A Ciência de Dados tem mais
a ver com a resolução de problemas do que com Analytics, o exame e a
plotagem de dados", diz Hunt.

Ciência de dados vs Big Data
A Ciência de Dados e o Big Data geralmente são vistos como conceitos
conectados, mas os cientistas de dados não trabalham apenas com big
data. A Ciência de Dados pode ser usada para extrair valor de dados de
todos os tamanhos, sejam eles estruturados, não estruturados ou
semi estruturados.

Big Data é útil para as equipes de Ciência de Dados em muitos casos, porque quanto mais dados estiver disponíveis,
mais parâmetros serão incluídos em um determinado modelo. "Big data
ajuda em certos aspectos, mas nem sempre é melhor. Por exemplo, o
mercado de ações não funciona em uma linha, então não vai funcionar”,
comenta o executivo.

Valor comercial da ciência de dados
O
valor comercial da Ciência de Dados depende da organização que a está
usando. Ela pode ajudar a criar ferramentas para prever falhas de
hardware, permitindo que a empresa realize a manutenção preditiva e evite o tempo
de inatividade. Pode ser usada para prever o que colocar nas prateleiras
dos supermercados, ou quão popular um produto será baseado em seus
atributos.

"O maior valor que uma equipe de Ciência de Dados pode
ter é ser incorporados às equipes de negócio. Uma pessoa
inovadora vai encontrar valor que outras pessoas não esperavam", diz Ted
Dunning, arquiteto chefe de aplicações da MapR Technologies.

Ferramentas de Ciência de Dados
As
equipes fazem uso de uma ampla gama de ferramentas, incluindo SQL,
Python, R, Java e uma infinidade de projetos de código aberto, como
Hive, Oozie e TensorFlow. Essas ferramentas são usadas para tarefas
relacionadas a dados, desde extrair e limpar dados, até submeter dados a
análises algorítmicas via métodos estatísticos ou Inteligência Artificial.

De acordo com Dunning, o cientista de dados precisa
olhar criticamente para aspectos muito simples dos dados. "O
profissional precisa de boas ferramentas de visualização e ferramentas de
programação - o Python é um favorito das probabilidades neste momento.
São necessárias, também, ferramentas que realmente construirão modelos
interessantes", diz Dunning.

cienciadedados

Habilidades em Ciência de Dados
A Ciência de Dados é uma área em evolução e há muitas maneiras de
aprender sobre ela. Porém, ainda que o número de programas de graduação
em Ciência de Dados esteja aumentando rapidamente, eles não são
necessariamente o que as organizações procuram quando buscam cientistas
de dados.

O Stange-Tregear, do eBates, diz que busca candidatos
com histórico de Estatística, conhecimento do negócio para
contextualizar resultados e habilidades de comunicação para apresentar os resultados a usuários corporativos.

"Dou preferência
para PhDs, mas não deixaria de lado alguém que tem
muita experiência", diz Hunt. "Um PhD é capaz de fazer uma pesquisa
muito profunda sobre um tópico e é capaz de disseminar essa informação
para os outros. Mas ter um sólido background ou projeto pessoal é
incrivelmente interessante."

Hunt diz que ele, particularmente,
procura por PhDs em Física, Matemática, Ciência da Computação, Economia
ou Ciências Sociais. Ainda que não dispense candidatos com graduação
em Ciência de Dados ou Analytics, ele tem reservas. "Minha experiência
pessoal é que eles são muito úteis, mas se concentram demasiadamente nas
operações dos modelos e não na mentalidade do processo".

Dunning
se importa mais com a capacidade do candidato de mostrar algo novo. "O
que mais levo em conta é se o entrevistado me ensinou alguma coisa. Não quero contratar pessoas que saibam como fazer o que eu também sei.
Eu quero encontrar pessoas que possam fazer coisas que eu não posso
fazer, ou que ensinem coisas para o time”, explica.

Para
Dunning, alguns dos melhores cientistas de dados ou líderes em grupos de Ciência de Dados têm origens não tradicionais. Ele cita, por exemplo,
algumas pessoas que já passaram pela empresa e trabalharam como
jardineiro antes de ir para a faculdade, tinham um diploma de
literatura francesa ou de jornalismo, com
pouco treinamento formal em informática.

Analistas e cientistas de dados são as profissões quentes agora, dado
o valor que eles podem entregar para as empresas – especialmente
aquelas que estão guardando os grandes volumes de informação digital que
estão sendo reunidas a cada minuto.

No entanto, não há profissionais suficientes para preencher todas as
posições abertas e isso significa que oportunidades de descobrir novos
insights estão sendo perdidas enquanto as empresas se esforçam para
preencher esses papéis cruciais.

O principal desafio é que os cientistas de dados têm um conjunto de
habilidades muito específico: uma experiência nascida de educação,
tempo, experiência e capacidade técnica. Qualquer outro que falte um ou
dois aspectos desse conjunto não consegue preencher todos os requisitos
que as empresas anseiam.

Mesmo que os avanços da tecnologia ajudem a fazer o que costumava
estar na seara de Ph.D’s, ainda há muitas vagas abertas que necessitam
de qualidades como perícia na análise de dados, uma tendência que não
mostra sinais de reversão a curto prazo.

Cada indústria tem seu próprio grande perfil de profissional de
análise de dados. Aqui estão algumas das formas mais comuns em cada
indústria, bem como os tipos de análise que o cientista de dados
provavelmente será obrigado a realizar.

- Negócios - Hoje, os dados moldam a estratégia de
negócios para quase todas as empresas - mas as empresas precisam de
cientistas de dados para darem sentido às informações derivadas de
dados. A análise de dados empresariais pode definir a tomada de decisão
orientada por eficiência, inventário,  fidelização de clientes e muito
mais.

- E-commerce - Os sites colecionam mais do que dados
de compras e, por isso, cientistas de dados ajudam os negócios de
comércio eletrônico a melhorar o atendimento ao cliente, encontrar
tendências e desenvolver serviços ou produtos.

- Finanças - No setor financeiro, os dados sobre
contas, transações de crédito e débito e dados financeiros similares são
vitais para o funcionamento do  negócio. Mas para cientistas de dados
neste campo, segurança e conformidade, incluindo detecção de fraude,
também estão entre as preocupações principais.

- Governo - O Big Data ajuda os governos a tomar
decisões, a apoiar os congressistas e a monitorar a satisfação geral.
Como no setor financeiro, a segurança e a conformidade são uma
preocupação primordial.

- Ciência - Os cientistas sempre manipularam dados,
mas agora, com tecnologia, eles podem melhorar a coleta,
compartilhamento e a análise de dados de experiências. Os cientistas de
dados podem ajudar com esse processo.

- Redes sociai - Os dados de redes sociais ajudam a
divulgar publicidade segmentada, melhorar a satisfação do cliente,
estabelecer tendências em dados de localização e aprimorar recursos e
serviços. A análise contínua de dados de postagens, tweets, blogs e
outras mídias sociais pode ajudar as empresas a melhorar constantemente
seus serviços.

- Saúde -  Os registros médicos eletrônicos são
agora o padrão nas instalações de saúde, o que exige uma dedicação em
relação a Big Data, segurança e conformidade. Aqui, os cientistas de
dados podem ajudar a melhorar os serviços de saúde e descobrir
tendências que podem passar despercebidas de outra forma.

- Telecomunicações - Todos os produtos eletrônicos
coletam dados e todos esses dados precisam ser armazenados, gerenciados,
mantidos e analisados. Cientistas de dados ajudam as empresas a
espreitar insetos, melhorar produtos e manter os clientes satisfeitos
através da entrega dos recursos que desejam.

Habilidades
De acordo com William Chen, Gerente
de Ciência de Dados da Quora, as cinco principais habilidades para
cientistas de dados incluem uma mistura de habilidades técnicas e
suaves:

- Programação: Chen cita programação como o "mais
fundamental do conjunto de habilidades de um cientista de dados",
observando que agrega valor às habilidades do profissional. A
programação melhora as habilidades estatísticas do profissional, ajuda a
"analisar grandes conjuntos de dados" e oferece a capacidade de criação
das próprias ferramentas.

- Análise quantitativa: Uma habilidade importante
para analisar grandes conjuntos de dados, a análise quantitativa irá
melhorar a capacidade do profissional de executar análises
experimentais, dimensionar sua estratégia de dados e ajudá-lo a
implementar Machine Learning.

- Intuição do produto: Compreender os produtos irá
ajudar o profissional a realizar análises quantitativas, diz Chen.
Também irá ajudá-lo a prever o comportamento do sistema, estabelecer
métricas e melhorar as habilidades de depuração.

- Comunicação: Possivelmente as habilidades mais
importantes em todos os setores, uma forte capacidade de comunicação irá
ajudar o profissional a "aproveitar todas as habilidades anteriores
listadas", diz Chen.

- Trabalho em equipe: Muito parecido com
comunicação, o trabalho em equipe é vital para uma carreira bem sucedida
em ciência dos dados. Ele exige que o profissional seja abnegado, seja
receptivo a feedbacks e compartilhe seu conhecimento com sua equipe, diz
Chen.

Educação e treinamento
Há muitas maneiras de um
profissional se tornar um cientista de dados, mas a rota mais
tradicional é obtendo um diploma de bacharel. A maioria dos cientistas
de dados tem mestrado ou doutorado, mas existem outras formas de
desenvolver habilidades para a profissão. Antes de optar por qualquer
delas é preciso saber em que setor o profissional irá trabalhar para
descobrir as habilidades, ferramentas e software mais importantes.

Como a Ciência dos Dados requer alguma experiência em domínio de
negócios, o papel de um cientista de dados varia dependendo da
indústria. Se for uma indústria altamente técnica, talvez seja
necessário treinamento adicional. Por exemplo, se o profissional for
trabalhar em saúde, governo ou ciência, precisará de uma habilidade
diferente daqueles que atuarão em marketing, negócios ou educação.

Se você quiser desenvolver certos conjuntos de habilidades para
atender às necessidades específicas da indústria, existem aulas on-line,
campos de inicialização e cursos de desenvolvimento profissional que
podem ajudar a aprimorar suas habilidades.

Se você precisa treinar a equipe para começar a trabalhar com Ciência de Dados, há alguns cursos online que podem
ajudá-lo. A Udemy, marketplace de
cursos online e uma das principais referências mundiais em educação à
distância, conta com mais de 55 mil cursos e uma série deles dedicado ao
ensino de linguagem de programação, com opções dedicadas exclusivamente
a formação em data science.

A empresa do Vale do Silício e a IDG contam com um canal exclusivo de cursos para os leitores dos sites IDGNow!, Computerworld, Macworld, PC World e CIO. O
canal oferece, a preços excepcionalmente reduzidos, milhares de cursos e
preparações para certificações em tecnologia da informação e internet,
em português. 

Na lista a seguir, separamos três cursos voltados para a formação de cientistas de dados e que saem apenas por apenas R$29,99.

1. Data Science de A a Z
Nesse curso voltado para iniciantes, você aprenderá lógica de
programação, manipulação de arquivos, visualização de gráficos, entre
outras etapas, usando a linguagem Python. Outros conteúdos incluem carga
de dados com integration services e Análise em R e conceitos
fundamentais de Estatística.

Com 95% de desconto, este curso sai por R$29,99 

2. Python para Data Science e Machine Learning
Este curso será seu guia para aprender a usar todo o poder do Python
para analisar dados, criar excelentes visualizações e usar algoritmos de
Machine Learning. O treinamento foi concebido para principiantes com
alguma experiência de programação ou desenvolvedores experientes que
procuram dar um salto em direção à ciência dos dados. Com mais de 100
aulas de vídeo e notebooks de códigos detalhados para cada palestra,
este é um dos cursos mais abrangentes para ciência de dados e Machine
Learning na Udemy.

Aproveite, este curso também sai por R$ 29,99

3. Curso completo de Banco de Dados e SQL
A boa notícia é que para realizar este curso não é necessário nenhum
requisito. Todos os softwares, técnicas, instalações e infraestrutura do
curso serão passados ao aluno desde o nível básico ao nível avançado.

O curso de Banco de Dados abrange do básico ao avançado, não somente a
linguagem SQL como também tarefas de infraestrutura, inerentes a um
DBA. Desde a base no banco MySQL para uma melhor compreensão, ao SQL
Server, onde são ensinados aspectos básicos até o intermediário avançado
como triggers e ccurspres, e finalmente para o Oracle, onde alunos
aprenderão sobre os dois maiores bancos do mercado 

Este curso é outro que se encontra com 95% de desconto e sai por R$29,99

Junte-se a nós e receba nossas melhores histórias de tecnologia. Newsletter Newsletter por e-mail