Robôs – Um novo método de aprendizado
23 de março de 2021Uma das maiores coisas que impedem a revolução dos robôs é sua incapacidade de se adaptar. Isso pode estar prestes a mudar, no entanto, graças a uma nova abordagem que combina habilidades pré-aprendidas na hora para enfrentar novos desafios.
Coloque um robô em um ambiente rigidamente controlado e ele pode superar rapidamente o desempenho humano em tarefas complexas, desde construir carros até jogar tênis de mesa . Mas jogue essas máquinas em uma bola curva e elas terão problemas – basta verificar esta compilação de alguns dos robôs mais avançados do mundo que se soltam diante de obstáculos notoriamente desafiadores, como areia, degraus e portas.
O motivo pelo qual os robôs tendem a ser tão frágeis é que os algoritmos que os controlam geralmente são projetados manualmente. Se eles se depararem com uma situação na qual o designer não pensou, o que é quase inevitável no caótico mundo real, eles simplesmente não terão as ferramentas para reagir.
Avanços rápidos em IA forneceram uma solução alternativa em potencial, permitindo que os robôs aprendessem a realizar tarefas em vez de depender de instruções codificadas manualmente. Uma abordagem particularmente promissora é o aprendizado por reforço profundo, onde o robô interage com seu ambiente por meio de um processo de tentativa e erro e é recompensado por realizar as ações corretas. Depois de muitas repetições, ele pode usar esse feedback para aprender como realizar a tarefa em questão.
Mas a abordagem requer grandes quantidades de dados para resolver até mesmo tarefas simples. E a maioria das coisas que gostaríamos que um robô fizesse são, na verdade, compostas por muitas tarefas menores – por exemplo, entregar um pacote envolve aprender como pegar um objeto, como andar, como navegar e como passar um objeto para outra pessoa, entre outras coisas.
Treinando todos esses sub-tarefas ao mesmo tempo é extremamente complexo e muito além das capacidades da maioria dos atuais AI sistemas, por isso estou quaisquer experiências até agora se concentraram em habilidades estreitas. Alguns tentaram treinar IA em várias habilidades separadamente e, em seguida, usar um sistema abrangente para alternar entre esses subsistemas especializados, mas essas abordagens ainda não podem se adaptar a desafios completamente novos.
Construindo fora desta pesquisa, no entanto, os cientistas já criou um novo sistema de inteligência artificial que pode se misturam sub-sistemas especialistas speciali z ed para uma tarefa específica. Em um artigo na Science Robotics , eles explicam como isso permite que um robô de quatro patas improvise novas habilidades e se adapte a desafios desconhecidos em tempo real.
A técnica, chamada de arquitetura de aprendizagem multi-especialista (MELA), baseia-se em uma abordagem de treinamento em dois estágios. Primeiro, os pesquisadores usaram uma simulação de computador para treinar duas redes neurais para realizar duas tarefas distintas: trotar e se recuperar de uma queda.
Eles então usaram os modelos destas duas redes aprendidas como sementes para oito outras redes neurais speciali z ed para habilidades motoras mais específicos, como rolar ou girar para a esquerda ou direita. As oito “redes de especialistas” foram treinadas simultaneamente com uma “rede de portas”, que aprende como combinar esses especialistas para resolver desafios.
Como a rede de portas sintetiza as redes de especialistas em vez de ligá-las sequencialmente, a MELA é capaz de criar combinações de diferentes especialistas que permitem resolver problemas que ninguém poderia resolver sozinho.
Os autores comparam a abordagem à formação de pessoas em como jogar futebol. Você começa fazendo com que eles façam exercícios em habilidades individuais, como driblar, passar ou chutar. Depois de dominá-los, eles podem combiná-los de forma inteligente para lidar com situações mais dinâmicas em um jogo real.
Depois de treinar o algoritmo em simulação, os pesquisadores o carregaram em um robô de quatro patas e o submeteram a uma bateria de testes, tanto internos quanto externos. O robô foi capaz de se adaptar rapidamente a superfícies complicadas, como cascalho ou seixos, e se recuperou rapidamente de ser empurrado repetidamente antes de continuar seu caminho.
Ainda há um caminho a percorrer antes que a abordagem possa ser adaptada para robôs do mundo real comercialmente úteis. Para começar, o MELA atualmente não é capaz de integrar a percepção visual ou uma sensação de toque; ele simplesmente depende do feedback das articulações do robô para dizer o que está acontecendo ao seu redor. Quanto mais tarefas você pedir ao robô para dominar, mais complexo e demorado será o treinamento.
No entanto, a nova abordagem aponta para uma maneira promissora de fazer robôs multi-qualificados se tornarem mais do que a soma de suas partes . Por mais divertido que seja, parece que rir de compilações de robôs desajeitados pode em breve ser uma coisa do passado.