Tech

Estrutura de IA guiada por humanos promete aprendizado robótico mais rápido em novos ambientes

Na futura era das casas inteligentes, comprar um robô para agilizar as tarefas domésticas não será uma raridade. No entanto, a frustração pode surgir quando esses ajudantes automatizados não conseguem realizar tarefas simples. Entra em cena Andi Peng, acadêmica do departamento de Engenharia Elétrica e Ciência da Computação do MIT, que, junto com sua equipe, está traçando um caminho para melhorar a curva de tirocínio dos robôs.

Peng e sua equipe interdisciplinar de pesquisadores foram os pioneiros em uma estrutura interativa entre humanos e robôs. O destaque deste sistema é a sua capacidade de gerar narrativas contrafactuais que identificam as mudanças necessárias para que o robô execute uma tarefa com sucesso.

Para ilustrar, quando um robô se esforça para reconhecer uma caneca com uma pintura peculiar, o sistema oferece situações alternativas nas quais o robô teria conseguido, talvez se a caneca fosse de uma cor mais preponderante. Essas explicações contrafactuais, aliadas ao feedback humano, agilizam o processo de geração de novos dados para o ajuste fino do robô.

Peng explica: “O ajuste fino é o processo de otimização de um padrão de tirocínio de máquina existente que já é proficiente em uma tarefa, permitindo-lhe realizar uma segunda tarefa análoga”.

Um salto em eficiência e desempenho

Quando testado, o sistema apresentou resultados impressionantes. Os robôs treinados sob levante método demonstraram habilidades de aprendizagem rápidas, ao mesmo tempo que reduziram o comprometimento de tempo de seus professores humanos. Se implementada com sucesso em maior graduação, esta estrutura inovadora poderá ajudar os robôs a adaptar-se rapidamente a novos ambientes, minimizando a premência de os utilizadores possuírem conhecimentos técnicos avançados. Esta tecnologia pode ser a chave para desbloquear robôs de uso universal, capazes de ajudar eficientemente pessoas idosas ou deficientes.

Peng acredita: “O objetivo final é capacitar um robô para aprender e funcionar em um nível abstrato semelhante ao humano”.

Revolucionando o treinamento de robôs

O principal travanca na aprendizagem robótica é a “mudança de distribuição”, um termo usado para explicar uma situação em que um robô encontra objetos ou espaços aos quais não foi exposto durante o período de treinamento. Os pesquisadores, para resolver esse problema, implementaram um método publicado uma vez que “aprendizagem por imitação”. Mas teve suas limitações.

“Imagine ter que fazer uma mostra com 30 milénio canecas para um robô pegar qualquer caneca. Em vez disso, prefiro provar com exclusivamente uma caneca e ensinar o robô a entender que pode pegar uma caneca de qualquer cor”, diz Peng.

Em resposta a isso, o sistema da equipe identifica quais atributos do objeto são essenciais para a tarefa (uma vez que o formato de uma caneca) e quais não são (uma vez que a cor da caneca). Munido dessas informações, ele gera dados sintéticos, alterando os elementos visuais “não essenciais”, otimizando assim o processo de aprendizagem do robô.

Conectando o raciocínio humano com a lógica robótica

Para julgar a eficiência desta estrutura, os pesquisadores realizaram um teste envolvendo usuários humanos. Os participantes foram questionados se as explicações contrafactuais do sistema melhoraram a sua compreensão do desempenho da tarefa do robô.

Peng diz: “Descobrimos que os humanos são inerentemente adeptos desta forma de raciocínio contrafactual. É levante elemento contrafactual que nos permite transcrever perfeitamente o raciocínio humano em lógica robótica.”

No transcurso de múltiplas simulações, o robô aprendeu consistentemente mais rápido com sua abordagem, superando outras técnicas e precisando de menos demonstrações dos usuários.

Olhando para o porvir, a equipe planeja implementar esta estrutura em robôs reais e trabalhar para reduzir o tempo de geração de dados por meio de modelos generativos de tirocínio de máquina. Esta abordagem inovadora tem o potencial de transformar a trajetória de aprendizagem dos robôs, abrindo caminho para um porvir onde os robôs coexistam harmoniosamente na nossa vida quotidiana.

Unite AI Mobile Newsletter 1

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button