Tech

Pesquisadores do MIT combinam dados de movimento de robôs com modelos de linguagem para melhorar a execução de tarefas

Os robôs domésticos são cada vez mais ensinados a realizar tarefas complexas através da aprendizagem por imitação, um processo no qual são programados para copiar os movimentos demonstrados por um ser humano. Embora os robôs tenham provado ser excelentes imitadores, muitas vezes têm dificuldade em ajustar-se a interrupções ou situações inesperadas encontradas durante a execução de tarefas. Sem programação explícita para lidar com esses desvios, os robôs são forçados a iniciar a tarefa do zero. Para enfrentar este desafio, os engenheiros do MIT estão a desenvolver uma nova abordagem que visa dar aos robôs um sentido de bom senso quando confrontados com situações inesperadas, permitindo-lhes adaptar-se e continuar as suas tarefas sem necessitar de intervenção handbook.

A nova abordagem

Os pesquisadores do MIT desenvolveram um método que combina dados de movimento de robôs com o “conhecimento de senso comum” de grandes modelos de linguagem (LLMs). Ao conectar esses dois elementos, a abordagem permite que os robôs analisem logicamente uma determinada tarefa doméstica em subtarefas e se ajustem fisicamente às interrupções dentro de cada subtarefa. Isso permite que o robô siga em frente sem ter que reiniciar toda a tarefa desde o início e elimina a necessidade de os engenheiros programarem explicitamente correções para cada falha possível ao longo do caminho.

Como explica o estudante de pós-graduação Yanwei Wang, do Departamento de Engenharia Elétrica e Ciência da Computação (EECS) do MIT: “Com nosso método, um robô pode autocorrigir erros de execução e melhorar o sucesso geral da tarefa”.

Para demonstrar sua nova abordagem, os pesquisadores usaram uma tarefa simples: retirar bolinhas de gude de uma tigela e despejá-las em outra. Tradicionalmente, os engenheiros moveriam um robô através de movimentos de escavar e despejar em uma trajetória fluida, muitas vezes fornecendo múltiplas demonstrações humanas para o robô imitar. No entanto, como salienta Wang, “a demonstração humana é uma trajetória longa e contínua”. A equipe percebeu que, embora um ser humano possa demonstrar uma única tarefa de uma só vez, a tarefa depende de uma sequência de subtarefas. Por exemplo, o robô deve primeiro alcançar uma tigela antes de poder colher, e deve recolher bolinhas de gude antes de passar para a tigela vazia.

Se um robô cometer um erro durante qualquer uma dessas subtarefas, seu único recurso é parar e começar desde o início, a menos que os engenheiros rotulem explicitamente cada subtarefa e programem ou coletem novas demonstrações para o robô se recuperar da falha. Wang enfatiza que “esse nível de planejamento é muito tedioso”. É aqui que entra em jogo a nova abordagem dos pesquisadores. Ao aproveitar o poder dos LLMs, o robô pode identificar automaticamente as subtarefas envolvidas na tarefa geral e determinar possíveis ações de recuperação em caso de interrupções. Isto elimina a necessidade de os engenheiros programarem manualmente o robô para lidar com todos os cenários de falha possíveis, tornando o robô mais adaptável e eficiente na execução de tarefas domésticas.

O papel dos grandes modelos de linguagem

Os LLMs desempenham um papel essential na nova abordagem dos pesquisadores do MIT. Esses modelos de aprendizagem profunda processam vastas bibliotecas de texto, estabelecendo conexões entre palavras, frases e parágrafos. Através destas conexões, um LLM pode gerar novas frases com base em padrões aprendidos, essencialmente compreendendo o tipo de palavra ou frase que provavelmente se seguirá à última.

Os pesquisadores perceberam que essa capacidade dos LLMs poderia ser aproveitada para identificar automaticamente subtarefas dentro de uma tarefa maior e possíveis ações de recuperação em caso de interrupções. Ao combinar o “conhecimento de bom senso” dos LLMs com dados de movimento do robô, a nova abordagem permite que os robôs analisem logicamente uma tarefa em subtarefas e se adaptem a situações inesperadas. Esta integração de LLMs e robótica tem o potencial de revolucionar a forma como os robôs domésticos são programados e treinados, tornando-os mais adaptáveis ​​e capazes de lidar com os desafios do mundo actual.

À medida que o campo da robótica continua a avançar, a incorporação de tecnologias de IA como os LLMs tornar-se-á cada vez mais importante. A abordagem dos investigadores do MIT é um passo significativo para a criação de robôs domésticos que possam não só imitar as ações humanas, mas também compreender a lógica e a estrutura subjacentes às tarefas que executam. Esta compreensão será basic para o desenvolvimento de robôs que possam operar de forma autônoma e eficiente em ambientes complexos do mundo actual.

Rumo a um futuro mais inteligente e adaptável para robôs domésticos

Ao permitir que os robôs corrijam erros de execução e melhorem o sucesso geral das tarefas, este método aborda um dos maiores desafios na programação de robôs: adaptabilidade a situações do mundo actual.

As implicações desta pesquisa vão muito além da simples tarefa de colher bolinhas de gude. À medida que os robôs domésticos se tornam mais predominantes, eles precisarão ser capazes de realizar uma ampla variedade de tarefas em ambientes dinâmicos e não estruturados. A capacidade de dividir tarefas em subtarefas, compreender a lógica subjacente e adaptar-se às interrupções será essencial para que estes robôs operem de forma eficaz e eficiente.

Além disso, a integração de LLMs e robótica mostra o potencial das tecnologias de IA para revolucionar a forma como programamos e treinamos robôs. À medida que estas tecnologias continuam a avançar, podemos esperar ver robôs mais inteligentes, adaptáveis ​​e autónomos nas nossas casas e locais de trabalho.

O trabalho dos pesquisadores do MIT é um passo crítico para a criação de robôs domésticos que possam realmente compreender e navegar pelas complexidades do mundo actual. À medida que esta abordagem é aperfeiçoada e aplicada a uma gama mais ampla de tarefas, tem o potencial de transformar a forma como vivemos e trabalhamos, tornando as nossas vidas mais fáceis e mais eficientes.

Unite AI Mobile Newsletter 1

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button