Fazer login no IT Mídia Redefinir senha
Bem-vindo de volta,
Digite seu e-mail e clique em enviar
Ainda não tem uma conta? Cadastre-se
Salvar em Nova pasta de favoritos

+

Criar pasta
Salvar Escolher Pasta
6 dicas essenciais para evitar um desastre na análise de dados
Home > Gestão

6 dicas essenciais para evitar um desastre na análise de dados

Dada a promessa de valor comercial, não é surpresa que a análise de dados continue o principal investimento em TI. Mas sucesso não é garantido

Bob Violino, CIO (EUA)

05/05/2020 às 14h02

Foto: Shutterstock

A análise de dados pode ser extremamente valiosa para as empresas, fornecendo insights profundos sobre dados que, de outra forma, não poderiam surgir.

Por esse motivo, a análise de dados continua consumindo uma parte significativa dos orçamentos de TI. Trinta e sete por cento dos líderes do setor disseram que analytics gerará o maior investimento em TI em suas empresas este ano, a categoria mais alta, de acordo com a pesquisa “2020 State of the CIO”.

Mas não há garantias de que os investimentos em analytics sejam recompensados. De fato, a disciplina pode estar repleta de problemas que podem atrapalhar temporariamente esses projetos ou condená-los ao fracasso.

Evitar resultados negativos está ao alcance de qualquer empresa que queira explorar analytics - apenas exige a preparação e o trabalho necessários. Aqui estão algumas etapas que as organizações podem adotar para evitar desastres e decepções na análise de dados.

CIO2503

E-book por:

Tenha uma estratégia geral de gerenciamento de dados

Uma das primeiras etapas que uma empresa deve seguir é criar uma estratégia geral de gerenciamento de dados que defina a coleta, o processamento e a análise dos dados, diz Seth Robinson, Diretor Sênior de Análise de Tecnologia da organização profissional de TI CompTIA.

“As empresas já adotaram medidas semelhantes com a cibersegurança como um componente crítico de negócios da TI, e o gerenciamento de dados deve seguir o mesmo caminho, já que os dados se tornaram tão importantes para as operações comerciais”, diz Robinson.

A CompTIA divulgou recentemente um relatório, "Trends in Data Management", com base em uma pesquisa on-line com 400 profissionais de TI nos Estados Unidos, realizada em dezembro de 2019, e mostra que muitas empresas estão nos estágios iniciais da construção de suas estratégias de gerenciamento de dados.

Apenas 25% das organizações pesquisadas sentem que estão exatamente onde querem estar com o gerenciamento de dados corporativos. Embora os dados digitais tenham sido parte das operações de TI, diz o relatório, não houve muito foco em termos de funções ou componentes definidos.
Um grande componente da estratégia é ter as habilidades corretas de análise de dados para atender às necessidades da empresa.

“As lacunas de habilidades relacionadas aos dados são o [terceiro maior] desafio que as empresas citam na criação de planos de gerenciamento de dados, e há uma variedade de diferentes habilidades de dados necessárias”, diz Robinson. Isso inclui administração de banco de dados, análise de dados e visualização de dados. "Algumas dessas habilidades podem ser ensinadas aos funcionários existentes, enquanto outras podem exigir novas contratações ou parcerias", diz ele.

Apenas 44% das empresas afirmam ter funcionários internos de TI dedicados ao gerenciamento ou análise de dados, de acordo com a CompTIA. Embora tenha havido um foco em cargos mais recentes, como cientista de dados, também há oportunidades em torno de funções mais tradicionais, incluindo administradores de banco de dados.

"Você deve consultar e/ou treinar seus funcionários para se tornarem alfabetizados em dados, ou ninguém em sua equipe saberá como iniciar a conversa sobre analytics", acrescenta Jeremy Wortz, Arquiteto Sênior na prática de tecnologia da empresa de consultoria West Monroe.

"Nem todo mundo precisa ser um cientista de dados, mas todos os líderes de negócios precisam ter um entendimento básico de como a análise pode gerar valor".

Tornar a integração de dados uma prioridade

Os problemas mais comuns relacionados à análise de dados realmente ocorrem no início do processo geral de fluxo de dados, com falta de integração de dados, diz Robinson. "Sem todos os dados corporativos vinculados, o analytics será limitado na busca de conexões e insights", diz ele.

O estudo da CompTIA concluiu que a integração de dados é o desafio número dois que as empresas citam em sua estratégia de gerenciamento de dados. Acelerar apenas a análise de dados teve uma classificação mais alta entre os desafios.

Por vários anos, a pesquisa da CompTIA descobriu que as unidades de negócios que trabalham independentemente em iniciativas de tecnologia acabam levando a um desafio com a integração. Como resultado, as organizações estão tentando evitar a shadow TI em favor de abordagens colaborativas que ainda dão liberdade às unidades de negócios, mantendo uma visão inclusiva de todos os sistemas de negócios.

A coleta de dados em um único repositório faz parte dessa abordagem, diz o relatório da CompTIA, e também é fundamental para as iniciativas de Inteligência Artificial (IA) que operam nos mais amplos conjuntos de dados possíveis. O estudo observa que os silos de dados não são amplamente considerados um problema entre os pesquisados, embora a integração de dados seja um grande desafio.

Considerando que 82% das empresas afirmam ter um grau alto ou moderado de silos de dados, "há uma clara desconexão sobre quão problemáticos são os silos de dados e como exatamente eles devem ser integrados a um conjunto de dados comum", segundo o relatório.

Além da integração técnica de fontes de dados, as empresas precisam estabelecer processos de compartilhamento de dados entre as várias unidades de negócios e a função de TI.

"Como em muitas outras partes da TI, há uma crescente necessidade de colaboração entre esses grupos", diz Robinson. “As unidades de negócios trazem o conhecimento de quais informações serão mais úteis e a equipe de TI possui a experiência necessária para fornecer a solução técnica. A comunicação regular criará os ciclos de feedback adequados para refinar a análise de dados para melhor atender os negócios”.

Pratique DataOps eficazes

DataOps (operações de dados) é uma metodologia automatizada, orientada a processos, que pode ser usada pelas equipes de análise de dados para melhorar a qualidade e reduzir o tempo de ciclo da análise. Começou como um conjunto de práticas recomendadas e amadureceu para se tornar uma abordagem nova e independente da análise de dados.

O método se aplica a todo o ciclo de vida dos dados, da preparação aos relatórios, e reconhece a natureza interconectada da equipe de análise de dados e das operações de TI.

Semelhante ao DevOps, o DataOps incorpora a metodologia ágil para reduzir o tempo do ciclo de desenvolvimento de analytics, alinhado aos objetivos de negócios. Enquanto o DevOps se concentra na entrega contínua de software de qualidade, aproveitando os recursos de TI e automatizando os testes e a implantação, o DataOps visa trazer as mesmas melhorias para a análise de dados.

“É essencial que as empresas implementem o DataOps completamente” se quiserem melhorar os resultados da análise, diz James Royster, Diretor Sênior de Estratégia e Operações de Dados da multinacional biofarmacêutica Amgen.

A empresa implantou uma plataforma DataOps da DataKitchen e teve "grande sucesso", diz Royster. "O DataOps envolve o design de analytics com tratamento de erros interno", diz ele. “A análise de dados precisa de maneiras automatizadas de testar e controlar a qualidade dos dados, a fim de reduzir erros e evitar problemas de integridade dos dados”.

As organizações encontram regularmente problemas de erro de dados que podem comprometer os projetos, diz Royster. Isso inclui erros no conjunto de dados subjacente. "Os dados brutos devem ser limpos e pré-processados", diz ele. "Erros são comuns em qualquer grande conjunto de dados".

Além disso, o fornecimento dos mesmos dados de diferentes locais com diferentes regras de negócios pode criar erros. "Diferentes organizações dentro da mesma empresa podem trabalhar com os mesmos dados usando algoritmos, fluxos de trabalho ou suposições diferentes", diz Royster.

Muitos também não conseguem conectar e transformar dados em um passo acelerado para atender às necessidades imediatas. "O mercado evolui rapidamente e os requisitos de negócios mudam", diz Royster. "A equipe de dados deve poder atualizar as transformações de dados para acompanhar as solicitações de usuários e partes interessadas".

Faça as perguntas certas de analytics

As organizações precisam manter o foco persistente nas questões-chave que podem agregar valor por meio da análise de dados, diz Wortz, de West Monroe.

“A verdade é que, não importa quão avançadas sejam suas ferramentas e tecnologia, seus dados não agregarão valor, a menos que você obtenha informações que gerem resultados estratégicos”, diz Wortz. Todas as análises, incluindo IA e machine learning (ML), devem gerar insights, acrescenta ele.

A chave para conseguir isso é fazer perguntas impactantes que facilmente se vinculam à criação de valor, diz Wortz. “Quanto tempo leva para os clientes em potencial se tornarem clientes? Por que eles se tornam clientes? Quando eles se tornam?”, ele diz. "Depois de obter as respostas da linha de base, você pode criar hipóteses relacionadas aos negócios e iniciar o processo novamente com perguntas novas e mais restritas".

West Monroe trabalhou recentemente com um cliente em uma iniciativa de machine learning e IA com foco em vendas.

“O modelo de machine learning gerou uma quantidade significativa de receita para a organização, mas mantivemos um impulso nas ideias do conjunto de dados durante toda a preparação do algoritmo”, diz Wortz. “Muitos de nós concordamos que o trabalho de ML gerou tanto valor ao encontrar informações geralmente aplicáveis nos dados, como um problema específico do cliente em uma determinada região com base em um produto específico, assim como inseriu dados no algoritmo de IA.

Isso deu à organização uma oportunidade rápida de agregar valor, já que West Monroe construiu o valor de longo prazo do sistema ML, "enquanto fornece um conjunto de dados de maior qualidade ao algoritmo", diz Wortz.

Analise apenas dados limpos e precisos

Essa prática pode estar sob o título de criar e executar uma estratégia geral de gerenciamento de dados. Mas merece menção como uma prática recomendada por si só. Se os dados que estão sendo analisados não forem precisos, os resultados e insights serão contaminados.

“O [passo] mais importante em minha mente é que os dados devem ser defensáveis, compreendidos e aceitos antes de fornecer qualquer insight”, diz Kathy Rudy, Diretora de Data e Analytics da ISG, uma empresa de consultoria e pesquisa em tecnologia.

"Isso significa que os dados são limpos, atuais, validados e de sistemas de registro confiáveis", diz Rudy. “Dados limpos significa que você passou um tempo revisando e limpando os dados antes de qualquer análise. Geralmente, isso pode levar uma quantidade considerável de tempo, especialmente se você estiver trabalhando em bancos de dados para entregar relatórios”.

Mas é uma etapa crítica, diz Rudy, e geralmente chamada de gerenciamento de dados mestre.

“A gerência deve comprar as fontes, a moeda e a precisão dos dados, caso contrário eles não comprarão os resultados e você gastará mais tempo defendendo os números do que agregando valor”, diz Rudy. "Isso também criará ciclos desnecessários para a equipe de dados e potencialmente fará com que você perca credibilidade".

Ter uma base técnica sólida é importante, "especialmente no que se refere à disponibilidade de dados", diz Pratyush Rai, CIO da Kaplan Higher Education, fornecedora de serviços on-line para estudantes. “Em muitas organizações, atenção insuficiente é dada à arquitetura subjacente. Isso leva à duplicação de registros e dados sujos, muitas vezes tornando o analytics um desafio”.

Crie uma equipe de análise colaborativa e coesa

Ser bem-sucedido em analytics e evitar decepções requer trabalho em equipe, e isso geralmente significa eliminar os silos dos departamentos.

“As organizações lutam para criar e compartilhar experiências de dados porque os dados são armazenados em vários silos e carecem de ferramentas para governança, descoberta de dados, catalogação e colaboração entre as equipes de engenharia, análise e negócios”, diz Maksym Schipka, CTO da Vortexa, empresa que fornece serviços de análise para o setor de energia.

"Estruture suas equipes como multifuncionais, equilibrando analistas de negócios, engenheiros de dados, cientistas de dados, engenheiros de software e garantia de qualidade em uma equipe", diz Schipka. "Evite as armadilhas de ter uma equipe de ciência de dados separada. Essa é a receita certa para um projeto com falha".

O Vortex garante que as equipes de analytics estejam totalmente integradas à escolha das ferramentas de análise usadas, como uma plataforma de operações de dados do Lenses.io e serviços de nuvem da Amazon Web Services.

Mas, independentemente das ferramentas de analytics em uso, as organizações devem ter uma combinação de cientistas e engenheiros de dados na equipe de análise de dados, diz Schipka. “A proporção exata dependerá da complexidade das questões comerciais que precisam ser respondidas e da complexidade das tecnologias necessárias para isso”, diz ela.

Vai um cookie?

A CIO usa cookies para personalizar conteúdo e anúncios, para melhorar sua experiência em nosso site. Ao continuar, você aceitará o uso. Para mais detalhes veja nossa Política de Privacidade.

Este anúncio desaparecerá em:

Fechar anúncio

15