Publicidade

A central de whitepapers de tecnologia do CIO

Tecnologia

Hadoop: Nove fornecedores que você deveria conhecer

Estudo da Forrester oferece uma visão panorâmica do mercado. Se sua companhia lida com muitos dados, a
tecnologia está, ou estará em breve no seu radar

Brandon BUtler, Network World

Publicada em 02 de julho de 2014 às 07h10

Antes reservado apenas aos grandes impérios da internet, como Google e Yahoo, o Hadoop, o mais conhecido e popular sistema para gestão de Big Data, começa agora a ser o queridinho das corporações

Há duas grandes razões para isso: as empresas têm muito mais dados para gerenciar e Hadoop é uma grande plataforma, especialmente por permitir combinar dados antigos do legado com novos dados não estruturados; um grande número de empresas do mercado está entrando no jogo oferecendo serviços e suporte em torno do Hadoop, tornando-o portanto mais palatável para as corporações.

Acrescente a isso o fato de que muitas empresas estimam que estão analisando no máximo 12% de todos os dados que possuem, deixando os outros 88% na mesa, sem aproveitamento, segundo o estudo “The Forrester Wave: Big Data Hadoop Solutions, Q1 2014.”

“A Forrester acredita que o Hadoop é uma plataforma que precisa ser usada em grandes empresas, formando a pedra angular de qualquer futura plataforma flexível de gestão de dados. Se você tem dados estruturados, não estruturados e binários, há espaço relevante para o Hadoop na sua empresa”, escrevem os analistas Mike Gualtieri e Noel Yuhanna, autores do estudo.

O Hadoop é um projeto open source cujos principais componentes podem ser baixados gratuitamente por qualquer pessoa. Várias empresas, da IBM à Amazon Web Services, passando por Microsoft e Teradata, trataram empacotar o Hadoop em serviços ou pacotes de consumo mais simples. Cada companhia assumiu uma estratégia ligeiramente diferente, mas o elemento comum é o Hadoop ter a habilidade de distribuir carga de trabalho potencialmente para centenas de servidores, tornando o Big Data gerenciável.

Realizado no primeiro trimestre de 2014, o estudo da Forrester olhou nove empresas e concluiu que não há ainda um líder claro de mercado nesse momento.

A lista de empresas que você vai ver a seguir foi elaborada pela Forrester Wave e, portanto, não representa a totalidade das plataformas e do mercado de gestão de Big Data. Pra evitar conflitos, alinhamos as empresas em ordem alfabética.

Amazon Web Services (AWS)
Clientes procurando por plataforma Hadoop em nuvem pública podem recorrer à empresa, que a Forrester chama de “King of the cloud”. O produto Hadoop da AWS chama-se Elastic Map Reduce (EMR). Não é um Hadoop open source puro, já que foi ajustado para rodar unicamente na nuvem da Amazon.

A Forrester diz que o EMR tem hoje a maior adoção entre as plataformas Hadoop disponíveis no mercado. A AWS vai lançar um suporte mais robusto para o EMR para outros produtos e serviços, incluindo o RedShift, para data warehouse e o recém-lançado motor de processamento em tempo real Kenesis. E deverá incluir suporte adicional para bases de dados NoSQL e ferramentas de BI.

O Hadoop da AWS é exclusivo da nuvem.

Cloudera
A Cloudera tem uma distribuição Hadoop open source que usa muitos aspectos do projeto original  Apache mas que agrega um grande número de melhorias, entre elas uma ferramenta de gestão e monitoramento chamada Cloudera Manager e um motor SQL para rodar dados relacionais no Hadoop, batizado de Impala.

A empresa usa o Hadoop como a base da sua distribuição, mas não é um produto open source puro. “A estratégia da Cloudera é manter a lealdade ao núcleo do Hadoop mas inovar com agressividade e velocidade para atender as demandas dos consumidores e diferenciar sua solução dos seus concorrentes”, diz a Forrester.

O resultado, segundo o relatório, é uma adoção firme da plataforma da Cloudera, que inclui uma lista de 200 clientes, alguns dos quais gerenciando mais de 1 petabyte de dados.

Hortonworks
Como a Cloudera, a Hortonworks é uma empresa Hadoop pure-play. E, diferente da Cloudera, a Hortonworks tem a distribuição de Hadoop mais próxima do código open source original, talvez mais do que qualquer outro concorrente.

A meta da Hortonworks é construir um ecossistema Hadoop e evoluir o código open source. Ela diz que isso beneficia os usuários porque evita que fiquem presos a um fornecedor (se um cliente da Hortonworks quiser deixar sua plataforma, poderá facilmente portar as aplicações para o código open source).

A postura da Hortonworks acabou garantindo parcerias fortes com fornecedores de peso como Teradata, Microsoft, Red Hat e SAP.

IBM
Quando as corporações pensam em grandes projetos de TI, muitas pensam na IBM, e com razão. Por causa disso, a IBM tornou-se um grande player no mundo Hadoop.

Segundo a Forrester, a IBM tem atualmente mais de 100 instalações de Hadoop, com  muitos de seus clientes gerindo petabytes de dados. A companhia tira vantagem da sua vasta experiência em computação, data center e implementação de projetos de Big Data.

“O road map da IBM inclui continuar integrando a solução BigInsights Hadoop a produtos como o analytics, gestão de carga de trabalho em computação de alta performance, ferramentas de BI e ferramentas de modelagem e gestão de dados”, afirma a Forrester.

Intel
Como a Amazon, a Intel está tirando vantagem e otimizando sua versão do Hadoop para rodar no seu hardware – especificamente,  processadores Xeon. Para clientes que procuram maior afinidade entre o software e hardware, a distribuição de Hadoop da Intel é potencialmente a solução ideal.

A Forrester ressalta que a Intel liberou recentemente seu produto, portanto é esperado que a companhia inove um pouco mais sobre a versão atual.

MapR Technologies
MapR Technologies é talvez a companhia com a melhor distribuição de Hadoop sobre a qual muitas pessoas nunca ouviram falar. Na pesquisa da Forrester com usuários de Hadoop, a MapR recebeu a maior nota por sua oferta atual,  por conta da arquitetura e dos recursos de processamento.

O tempero secreto da empresa é um conjunto de recursos únicos. O Hadoop da MapR suporta Network File Systems (NFS) e a MapR o incluiu na sua plataforma recursos de alto nível para recuperação de desastres e alta disponibilidade de dados.

A Forrester diz que a MapR deve investir em marketing e mais parcerias para ter o reconhecimento de marca que empresas como Cloudera e Hortonworks já possuem no mercado.

Microsoft
A Microsoft está avançando não só em habilitar o Hadoop para rodar em Windows, como em estar mais próxima de todo o ecossistema Hadoop. Os resultados do trabalho podem ser vistos no produto HDInsight, da nuvem pública Windows Azure. Trata-se de uma oferta de Hadoop como serviço baseada na distribuição da Hortonworks feita especificamente para rodar no Azure.

“A presença significativa da Microsoft nos mercados de banco de dados, data warehouse, cloud, OLAP, BI, planilhas, colaboração e ferramentas de desenvolvimento, oferece uma vantagem”, diz a Forrester.

Pivotal Software
No ano passado, a EMC e a VMware combinaram um punhado de produtos de cada uma delas para criar a Pivotal. Um dos grandes aspectos da nova empresa é trabalhar em sua distribuição Hadoop junto com a Cloud Foundry PaaS.

Ao fazer isso, a Pivotal agregou algum ferramental sobre o código aberto, especificamente um motor SQL chamado HAWQ e um appliance Hadoop feito especificamente para Big Data.

Até agora, a empresa tem menos de 100 instalações ativas, a maioria entre pequenas e médias empresas, diz a Forrester.

Teradata
Uma empresa como a Teradata poderia ver o Hadoop como uma ameaça ou uma oportunidade. Para uma empresa especializada em gestão de dados - particularmente no segmento de bancos de dados SQL e relacional - uma plataforma NoSQL como o Hadoop poderia ser uma ameaça.

Em vez disso, a Teradata abraçou o Hadoop. Ao fazer uma parceria com a Hortonworks, a Teradata agora oferece aos seus clientes a habilidade de usar a plataforma integrada com suas ofertas SQL, dando aos clientes uma plataforma Hadoop pronta para rodar, capaz de trabalhar sem empecilhos com dados já armazenados em warehouses Teradata.



Reportagens mais lidas