Recursos/White Papers

Notícias

Quatro nuvens de aprendizado de máquina para manter no radar

Amazon, Microsoft, Databricks, Google, HPE e kits de ferramentas de aprendizado de máquina da IBM formam um time de peso capaz de entregar profundidade e facilidade

Da Redação

Publicada em 16 de março de 2017 às 17h43

O que chamamos de aprendizado de máquina pode assumir muitas formas. A forma mais pura oferece ao analista um conjunto de ferramentas de exploração de dados, variedade de escolha de modelos ML, algoritmos de solução robusta, e uma maneira de usar as soluções para fazer previsões. As nuvens da Amazon , Microsoft , Google e IBM oferecerem, todas elas, APIs que permitem aos desenvolvedores incorporar recursos de Machine Learning em suas aplicações.

Nem todos os problemas de aprendizado de máquina têm que ser resolvidos a partir do zero, no entanto. Alguns problemas podem ser formados sobre uma amostra suficientemente grande para serem mais amplamente aplicáveis. Por exemplo, speech-to-text, text-to-speech, análise de texto e reconhecimento de face são problemas que soluções "enlatadas" muitas vezes resolvem. Portanto, não há nada de surpreendente emuma série de provedores de nuvem de aprendizado de máquina oferecerem essas capacidades através de APIs.

Existem muitos tipos de problemas de aprendizado de máquina. Por exemplo, os problemas de regressão tentam prever uma variável contínua (como vendas) de outras observações, e problemas de classificação tentam predizer a classe em que um determinado conjunto de observações cairão (digamos, spam no e-mail). Amazon, Microsoft, Databricks, Google, HPE e IBM fornecem ferramentas para resolver uma série de problemas de aprendizado de máquina, embora alguns toolkits sejam muito mais completos do que outros.

Uma breve história da IA
Inteligência Artificial (IA) tem uma história de altos e baixos. Os primeiros trabalhos foram direcionado para jogos (damas e xadrez) e resolução de teoremas. Depois vieram o processamento de linguagem natural e redes neurais. Após o "inverno da IA, na década de 1970, os sistemas especialistas tornaram-se comercialmente viáveis na década de 1980, embora as empresas por trás deles não tenham durado muito tempo.

Na década de 1990, a aplicação DART foi usada na primeira Guerra do Golfo, fazendo valer o investimento de 30 anos da DARPA em IA, e o Deep Blue, da IBM, derrotou o grande mestre de  xadrez Garry Kasparov. Na década de 2000, robôs autônomos tornaram-se viáveis para a exploração remota (Nomad, Spirit e Opportunity) e limpeza doméstica (Roomba). Na década de 2010 surgiram os jogos baseados em visão viável (Microsoft Kinect), carros autônomos (Google), o sistema Watson, da IBM, derrotou os dois últimos campeões do "Jeopardy", e o Alpha Go, da Google, derrotou um campeão de Go.

A linguagem natural chegou ao ponto de permitir o surgimento dos assistentes pessoais Siri, da Apple, Cortana, da Microsoft e o  Google Now. Finalmente, anos de pesquisa a respeito da capacidade de aprendizado com computadores, criação de algoritmos para reconhecimento de padrões e otimização a partir de dados históricos foram recompensados ​​no campo da aprendizagem de máquina.

Em 2015, a corrida para garantir qualquer "pedaço de terra" em inteligência artificial foi um dos aspectos mais visíveis da indústria. Ao menos 20 empresas de inteligência artificial foram adquiridas, de acordo com a CB Insights, uma empresa de análise de mercado de tecnologia. 

Em 2016, a Apple adquiriu a Emotient, Tuplejump e Turi, enquanto a Salesforce comprou a PredictionIQ e MetaMind; o Google adquiriu a Api.ai e Moodstocks; e a Intel, por sua vez, abocanhou a Itseez, Nervana Systems e Movidius. Mais recentemente, o Google comprou a Kaggle, plataforma que organiza competições de ciência de dados e machine learning.

Twitter, eBay, Oracle, Amazon, Microsoft e GE também adquiriram empresas focadas em IA. Algumas delas eram startups proeminentes, o que significa que as grandes empresas, muitas vezes, estavam tão interessadas na tecnologia quanto nos pesquisadores que estavam trabalhando nelas. Isso se dá porque os grandes players dentro e fora da indústria enxergam a IA no epicentro de toda solução, seja para ajudar os clientes a escolherem o revestimento perfeito pela Internet, ou dar-lhes orientações em torno de um acidente na estrada, encontrar ações fraudulentas em contas de clientes, ou interagir com clientes por comandos de voz, texto e aplicativos de bate-papo.

Em outras palavras, em 2017, os avanços da inteligência artificial podem começar a ganhar um efeito cascata, em vez de simplesmente avançar adiante. E a própria IA pode começar a alimentar esse progresso.

Neste artigo vamos discutir, brevemente, quatro soluções de aprendizado de máquina comerciais.

Google Cloud Machine Learning
O Google está convencido de que a IA pode mudar a forma como programamos e, recentemente,  anunciou uma série de produtos com a missão de democratizar o uso de Machine Learning e outras áreas da Inteligência Artificial. Os mais interessantes são o Cloud Machine Learning Engine, que com sua capacidade de treinamento distribuída possibilita treinar modelos envolvendo terabytes de dados em questão de horas, em vez de esperar por dias, e as APIs para sistemas de tradução e de reconhecimento de imagens. A API do Google Translate, por exemplo, pode executar a identificação linguagem e a tradução para mais de 80 idiomas e variantes.Já a API Cloud Vision permite que desenvolvedores criem aplicações que entendam o conteúdo de uma imagem, classificando imagens e encontrando caracteres em textos dentro dessas imagens. E a Video Intelligence API consegue reconhecer objetos em vídeos.

A tecnologia atual de aprendizado de máquina do Google usa o TensorFlow, disponibilizado como código aberto. Desenvolvido pela equipe Google, é um “sistema altamente escalável de machine learning do Google - que pode ser executado em um único smartphone ou em milhares de computadores em datacenters. Ele se integra com o Google Cloud Dataflow, o BigQuery, o Cloud Dataproc, a Cloud Storage e o Cloud Datalab.

Fui verificar o código TensorFlow no repositório GitHub; li alguns dos código C, C ++ e Python; e se debrucei sobre o white papers disponíveis no site TensorFlow.org. O TensorFlow permite implantar cálculos para uma ou mais CPUs ou GPUs em um desktop, servidor ou dispositivo móvel, e tem todos os tipos de algoritmos de rede neural.

Na prática, a Google Cloud Machine Learning oferece o TensorFlow como um serviço gerenciado.

"Pegamos todos os algoritmos especializados TensorFlow e disponibilizamos na nuvem, através de APIs", explica José Papo, Gerente do Programa de Relações com Desenvolvedores para América Latina. "Além da API mais geral, que é a Cloud Machine Learning API, ou simplesmente o TensorFlow na nuvem, disponibilizamos várias APIs especializadas, para resolver questões específicas de machine learning", comenta. 

Exemplos da oferta do Google incluem uma nova edição premium do API para tradução, voltada para trabalhos de grande volume, como a tradução de milhares de e-mails ou documentos, especialmente útil para empresas que precisam adotar essa tecnologia em escala. Em setembro, o Google anunciou que o Translate estava mudando para um novo sistema chamado Google Neural Machine Translation (GNMT), uma estrutura de aprendizagem de ponta a ponta que aprende com milhões de exemplos, resultando em melhorias significativas na qualidade da tradução. Ou seja, com o  sistema GNMT, em execução hoje em dia para todos os usuários do Google Translate, o tradutor do Google já está começando a errar menos.

Para os especialistas do Google, o “machine learning” ainda está “na adolescência”, e seu desenvolvimento só está sendo possível graças a junção de três fatore: a grande massa de  dados disponível na internet, o aumento da capacidade computacional, com as GPUs e o TPU e da quantidade e qualidade de engenheiros de software especializados na produção de algoritmos. 

Boa parte do que já é possível fazer com as ferramentas de ML do Google está compilado em um site chamado A.I. Experiments. Lá é possível encontrar oito ferramentas web para entender os benefício da Machine Learning brincando. Já ouviu falar no Quick Draw? Pois é, o sistema que adivinha o que você está desenhando com base nas informações que os ganhos de doodles de outras pessoas está lá. Assim como o Giorgio Cam, que usa a câmera do seu smartphone ou notebook para identificar objetos, e cria uma canção em torno do que ele pensa que está vendo.

Aprendizado de Máquina da Amazon
A Amazon também tem produrado colocar Machine Learning ao alcance dos meros mortais.  A intenção é fazer com que os analistas entendam o problema de negócio que está sendo resolvido, sem precisar compreender algoritmos e técnicas de aprendizado de máquina. Mas o produto também facilita o uso de tecnologia de aprendizado de máquina por desenvolvedores com todos os níveis de qualificação.

O serviçp oferece ferramentas de visualização e assistentes que guiam o usuário durante todo o processo de criação de modelos de aprendizagem de máquina (ML), sem que tenha que aprender algoritmos complexos. Uma vez que modelos são criados, o Amazon Machine Learning permite obter previsões do aplicativo usando APIs simples, sem a necessidade de implantar algoritmos complexos de análise de padrões,ou gerenciar qualquer infraestrutura.

Geralmente os usuários de negócios recorrem à Amazon Machine Learning fazendo o upload de seus dados para o S3. Em seguida, criam, treinam e avaliam um modelo ML, recorrendo a ferramentas e assistentes de visualização que orientam esses processos. Cada passo é iterativo. Após a conclusão dos modelos, o Amazon Machine Learning facilita a obtenção de previsões para aplicações usando APIs simples, sem necessidade de implementar um código de geração de previsões personalizado ou gerenciar qualquer infraestrutura.

A Amazon Machine Learning suporta três tipos de modelos - de classificação binária, classificação multiclasse, e de regressão - e tem um algoritmo para cada tipo. Para otimização, usa o Stochastic Gradient Descent (SGD).

Os modelos de ML são criados a partir do reconhecimento dos modelos nos dados existentes, e são usados pela Amazon Machine Learning para processar novos dados e gerar previsões para suas aplicações.

Uma vez que você tenha um modelo que atenda às suas necessidades de avaliação, você pode usá-lo para criar um serviço Web em tempo real ou para gerar um lote de previsões.

O serviço é altamente escalável e pode gerar bilhões de previsões diariamente, em tempo real e com alto rendimento.

Entre as aplicações possíveis está a detecção de fraudes, ciando modelos preditivos que ajudam a identificar transações potencialmente fraudulentas ou avaliações de itens fraudulentas ou inadequadas. Ou a classificação automática de documentos através do processamento de textos não estruturados.

O Amazon Machine Learning é usado pela amazon.com para gerar sugestões de compras, por exemplo.

machinelearning

Machine Learning na Azure
Em contraste com a Amazon e a Google, a Microsoft tenta fornecer uma variedade completa de algoritmos e ferramentas para cientistas de dados experientes. Assim, a Azure Machine Learning é parte da oferta Cortana Analytics Suite. Mas também possui uma interface drag-and-drop para a construção de modelos de treinamento.

Azure Machine Learning Studio contém facilidades para a importação de conjuntos de dados, formação e publicação de modelos experimentais, processamento de dados e obtenção de modelos treinados. O usuário encontrará dezenas de conjuntos de dados de amostra, cinco formatos de conversão de dados, várias maneiras de ler e gravar dados, etc. Estão disponíveis também vários modelos para detecção de anomalias, classificação, clustering, e regressão; quatro métodos para marcar modelos; três estratégias para avaliar modelos; e seis processos para treinar os modelos.

Studio é onde os cientistas de dados passarão a maior parte do tempo. Intuitiva, a experiência permite a execução de todos os passos do processo da ciência de dados, como acessar e preparar dados, criar, testar e treinar modelos, importar modelos proprietários já existentes na empresa no ambiente privado, entre outros.

Achou muita coisa? Em teoria, segundo a Microsoft, o usuário encontraá o suficiente para processar qualquer tipo de dado em qualquer tipo de modelo, desde que entenda o negócio, os dados e os modelos. E ainda poderá desenvolver módulos Python ou R, para suprir lacunas.

Quando você cria uma nova experiência no Azure Machine Learning Studio, você pode começar a partir do zero ou escolher entre cerca de 70 amostras que, segundo a Microsoft, abrangem a maioria dos modelos comuns.

O Cortana Analytics Process (CAP) começa com algumas etapas de planejamento e configuração que são críticas, a menos que você seja um cientista de dados treinado, já familiarizado com o problema de negócio, os dados e a Azure Machine Learning, e já tenha criado os ambientes necessários para o projeto incluindo uma conta de armazenamento Azure, uma máquina virtual Microsoft Data Science, um cluster HDInsight (Hadoop), e um espaço de trabalho de aprendizagem de máquina no Azure Machine Learning Studio.

Os dados usados em modelos do ML Studio podem vir de uma variedade de fontes: acessados já na Azure, consultados em Big Data na HDInsight e absorvidos dos desktops dos cientistas.

Quando os profissionais estiverem prontos para publicar os modelos, eles se tornam disponíveis aos desenvolvedores pelo serviço API, permitindo que os usuários corporativos acessem os resultados de qualquer dispositivo. As atualizações do modelo passam a alterar o atual em produção, sem precisar de um novo trabalho de desenvolvimento. Em essência, é aprendizado de máquina como serviço.

O Azure Machine Learning já está em uso, aplicado na análise de dados de telemetria, modelos de propensão de consumidores, análises de redes sociais, manutenção previsível, otimização de apps para a web, análise de churn, exploração de recursos naturais, previsão do tempo, antecipação de resultados médicos, detecção de fraude financeira, propaganda dirigida, etc.

A Microsoft disponibiliza documentação técnica adicional e acesso a um período de um mês para testes. É possível navegar pela galeria do ML Studio a procura de tutoriais de cinco minutos sobre a obtenção de dados amostrais, execução de experimentos, entre outros.

null

IBM Watson
A IBM oferece serviços de aprendizagem de máquina com base no Watson para três públicos diferentes: os desenvolvedores, os cientistas de dados e os usuários de negócios.

Entre eles estão 4 extensões do Watson para o SPSS Modeler, via IBM Bluemix. Três dessas extensões são criadas usando o Watson Language Translation Services e uma é criada usando o serviço Watson Personality Insights. Todas para trabalhar com textos (identificação, tradução, pontuação, etc)

Em alguns casos, os algoritmos de aprendizado de máquina em SPSS Modeler são comparáveis ​​com o que você encontra no Azure Machine Learning e Databricks 'Spark.ml, assim como os métodos de seleção de recursos e a seleção dos formatos suportados. Mesmo o Automodeling (marcar um monte de modelos e escolher o melhor) é comparável, embora seja mais evidente como usá-lo ] no SPSS Modeler do que nos outros.

O IBM Bluemix hospeda os serviços da Web de Predictive Analytics que se aplicam modelos SPSS para expor uma API de pontuação que você pode chamar de seus aplicativos. Além de serviços Web, o Predictive Analytics suporta trabalhos em lote para treinar e reavaliar modelos em dados adicionais.

Há ainda outros 18 serviços do Watson listados no BlueMix. O lchemyAPI oferece um conjunto de três serviços (AlchemyLanguage, AlchemyVision e AlchemyData) que permitem que empresas e desenvolvedores criem aplicativos cognitivos que entendem conteúdo e contexto em texto e imagens. A ferramenta é capaz de identificar nomes de pessoas, companhias e outros dados mencionados em artigos ou analisar fotos. A solução é gratuita para até 1000 eventos por empresa.

Concept Expansion permite analisar textos e aprender termos similares (palavras ou frases) baseada no contexto. A tecnologia ajuda usuários a criar rapidamente um léxico (conjunto de termos relacionados) de um grupo de dados ou fragmentos de textos. Os recursos podem, também, serem usados na compreensão de dados e melhorar estruturas de análise textual.  E o  Concept Insights conecta documentos que você oferece como base a gráficos ou conceitos baseados no Wikipedia. Dois tipos de links são identificados: explícitos (quando se referem a uma menção direta ao conceito) e implícito (que conecta seus documentos com conceitos relevantes não diretamente mencionados no texto). Usuários do serviço podem, também, procurar documentos relevantes a um determinado tema ou coleção de conceitos explorando essas conexões. As primeiras 25 mil chamadas de APIs em cada mês são gratuitas, depois disso, há cobrança. 

Dialog Service permite que desenvolvedores projetem formas para que aplicações interajam com usuários finais por meio de uma interface de conversação. Hhabilita aplicações com linguagem natural para prover respostas automáticas para questões encaminhadas por consumidores, encaminhamento de processos, ou atendimento para resolução de tarefas. A tecnologia pode, ainda, armazenar e mapear informações dos perfis dos usuários para aprender mais sobre os consumidores de uma empresa, guiando os consumidores por meio de processos ou os abastecendo de informações relevantes. A ferramenta é grátis para as primeiras 1 mil chamadas de APIs por mês. 

O Document Conversion converte HTML, PDF ou arquivos de Word em um HTML normalizado, planilha de textos ou conjunto de unidades de respostas formatadas que podem ser aplicadas junto a outras ferramentas disponíveis no Watson. Os primeiros 100 MB de cada mês são grátis. Depois, há cobrança por megabyte.

A ferramenta Language Translation trabalha em vários domínios de conhecimento e combinações linguísticas. Nos domínios de notícias e conversação, o de/para pares são Inglês e Português do Brasil, Francês, árabe moderno padrão, ou espanhol. Em patentes, os pares são o Inglês e Português do Brasil, chinês, coreano ou espanhol. O serviço de tradução pode identificar texto simples como sendo escrito em uma das 62 línguas. Para isso, basta conectar o serviço ao seu código e ele fará o trabalho.  O primeiro milhão de caracteres é gratuito.

O serviço Natural Language Classifier aplica técnicas de computação cognitiva para ajudar os usuários a criarem melhores frases ou parágrafos. Por exemplo, você submete uma questão e o serviço retorna com termos-chave que melhor se encaixam naquela resposta. Para “ensinar a máquina”, o usuário classifica instâncias provendo uma série de pontos representativos e marca as mais adaptadas dentro de um contexto. Depois desse treino, a solução vai evoluindo com o tempo. O que é grátis: uma instância do serviço por mês, 1 mil chamadas de APIs, quatro eventos de treinamento.

Personality Insights oferece insights baseados em dados transacionais e mídias sociais para identificar perfis psicológicos que podem determinar decisões de compra, intenções e comportamentos e, assim, ampliar taxas de conversão. As primeiras 100 chamadas de APIs são grátis.

E por aí vai...  É bastante simples acessar os serviços, basta entrar no site do Bluemix (www.bluemix.net) e preencher um breve cadastro. Feito isso, você receberá um e-mail de confirmação que te levará à página para entrar com login e senha na plataforma que agrupa vários serviços em nuvem da IBM.



Reportagens mais lidas

Acesse a comunidade da CIO

LinkedIn
A partir da comunidade no LinkedIn, a CIO promove a troca de informações entre os líderes de TI. Acesse aqui