Home > Tendências

5 perguntas sobre Deep Learning respondidas

Saiba por que as redes neurais são tão poderosas, como e onde são usadas e como começar - nenhuma programação necessária

InfoWorld (EUA)

13/03/2020 às 11h27

Foto: Shutterstock

Parece que em qualquer lugar que você olhe hoje em dia, você encontrará um artigo que descreve uma estratégia vencedora usando Deep Learning (DL) em um problema de ciência de dados ou, mais especificamente, no campo da Inteligência Artificial (IA).

No entanto, explicações claras do Deep Learning, por que ele é tão poderoso e as várias formas dele na prática, não são tão fáceis de encontrar. Para saber mais sobre aprendizado profundo, redes neurais, as principais inovações, os paradigmas mais usados, onde o Deep Learning funciona e não funciona, e até um pouco da história, perguntamos e respondemos algumas questões básicas.

O que é exatamente o Deep Learning?

O Deep Learning (aprendizado profundo) é a evolução moderna das redes neurais tradicionais. De fato, ao clássico feed-forward (controle por antecipação), totalmente conectado e treinado para retropropagação, Multilayer Perceptrons (MLPs), arquiteturas "mais profundas" foram adicionadas.

“Mais profundo” significa camadas mais ocultas e alguns novos paradigmas neurais adicionais, como em redes recorrentes e em redes convolucionais.

Qual é a diferença entre Deep Learning e redes neurais?

Não há diferença. As redes de DL são redes neurais, apenas com arquiteturas mais complexas do que era possível treinar nos anos 1990. Por exemplo, unidades de memória de longo prazo (LSTM) em redes neurais recorrentes (RNNs) foram introduzidas em 1997 por Hochreiter e Schmidhuber, mas nunca encontraram uma adoção extensiva devido ao longo do tempo computacional e aos altos recursos computacionais necessários.

CIO2503

E-book por:

Multilayer Perceptrons com mais de uma camada oculta também existem há muito tempo e seus benefícios eram claros. A principal diferença é que os recursos computacionais modernos tornaram sua implementação viável.

O Deep Learning oferece recursos computacionais mais rápidos e mais poderosos?

Em geral, recursos computacionais mais rápidos e mais poderosos permitiram a implementação e experimentação de arquiteturas neurais mais poderosas e promissoras. É claro que passar dias em treinamento de rede não pode rivalizar com os poucos minutos gastos no treinamento da mesma rede com a ajuda da aceleração da GPU.

O que torna o Deep Learning tão poderoso?

Em uma palavra, flexibilidade. Por um lado, redes neurais são aproximadoras de funções universais, o que é uma conversa inteligente para dizer que você pode aproximar quase qualquer coisa usando uma rede neural - se você a tornar complexa o suficiente. Por outro lado, você pode usar os pesos treinados de uma rede para inicializar os pesos de outra rede que executa uma tarefa semelhante. Isso é chamado de transferência de aprendizado e você ficaria surpreso com o quão bem ele funciona, mesmo para tarefas que parecem bastante diferentes à primeira vista.

O Deep Learning tomou conta de todo o mundo do Machine Learning?

Não, pelo menos ainda não. Existem certos domínios, como a visão computacional, nos quais você não consegue mais aprender profundamente, mas há outras áreas, como dados tabulares, que provaram ser um desafio para o DL. No caso de dados tabulares, que ainda é o principal formato usado para armazenar dados de negócios, o Deep Learning não está se saindo muito mal.

No entanto, é difícil justificar o treinamento de um modelo de DL por dias em um servidor GPU caro, se você pode obter precisão semelhante usando florestas aleatórias ou árvores com gradiente, que você pode treinar em poucos minutos em um laptop decente.

Junte-se a nós e receba nossas melhores histórias de tecnologia. Newsletter Newsletter por e-mail