Tech

Como os robôs estão aprendendo a pedir ajuda

No mundo em evolução da robótica, destaca-se uma colaboração inovadora entre a Universidade de Princeton e o Google. Engenheiros destas instituições de prestígio desenvolveram um método inovador que ensina aos robôs uma habilidade crucial: reconhecer quando precisam de ajuda e porquê solicitá-la. Leste desenvolvimento marca um salto significativo na robótica, preenchendo a vazio entre o funcionamento independente e a interação homem-robô.

A jornada rumo a robôs mais inteligentes e independentes sempre foi dificultada por um duelo significativo: a complicação e a anfibologia da linguagem humana. Ao contrário da nitidez binária dos códigos de computador, a linguagem humana está repleta de nuances e sutilezas, o que a torna um labirinto para robôs. Por exemplo, um comando tão simples porquê “pegue a tigela” pode se tornar uma tarefa complexa quando várias tigelas estão presentes. Os robôs, equipados para sentir o seu envolvente e responder à linguagem, muitas vezes encontram-se numa encruzilhada quando confrontados com tais incertezas linguísticas.

Quantificando a Incerteza

Para enfrentar nascente duelo, a equipa de Princeton e do Google introduziu uma novidade abordagem que quantifica a “indefinição” da linguagem humana. Esta técnica mede essencialmente o nível de incerteza nos comandos de linguagem e utiliza esta métrica para orientar as ações do robô. Em situações em que um comando pode levar a múltiplas interpretações, o robô pode agora calcular o nível de incerteza e sentenciar quando procurar mais esclarecimentos. Por exemplo, num envolvente com múltiplas tigelas, um maior proporção de incerteza levaria o robô a perguntar qual tigela pegar, evitando assim possíveis erros ou ineficiências.

Esta abordagem não só capacita os robôs com uma melhor compreensão da linguagem, mas também aumenta a sua segurança e eficiência na realização de tarefas. Ao integrar grandes modelos de linguagem (LLMs), porquê os que estão por trás do ChatGPT, os pesquisadores deram um passo significativo no alinhamento mais próximo das ações robóticas com as expectativas e necessidades humanas.

Papel dos grandes modelos de linguagem

A integração de LLMs desempenha um papel fundamental nesta novidade abordagem. LLMs são fundamentais no processamento e tradução da linguagem humana. Nesse contexto, eles são utilizados para calcular e medir a incerteza presente em comandos de linguagem dados a robôs.

No entanto, a subordinação de LLMs tem seus desafios. Tal porquê salientado pela equipa de investigação, os resultados dos LLM podem por vezes não ser fiáveis.

Anirudha Majumdar, professora assistente em Princeton, enfatiza a valimento deste estabilidade:

“Seguir cegamente os planos gerados por um LLM pode fazer com que os robôs atuem de maneira insegura ou indigna de crédito e, portanto, precisamos que nossos robôs baseados em LLM saibam quando não sabem.”

Isto realça a urgência de uma abordagem diferenciada, em que os LLM sejam utilizados porquê ferramentas de orientação e não porquê decisores infalíveis.

Emprego Prática e Teste

A praticidade deste método foi testada em diversos cenários, ilustrando sua versatilidade e eficiência. Um desses testes envolveu um braço robótico, encarregado de qualificar os víveres de brinquedo em diferentes categorias. Esta feitio simples demonstrou a capacidade do robô de velejar pelas tarefas com escolhas claras de forma eficiente.

Imagem: Universidade de Princeton

A complicação aumentou significativamente em outro experimento com um braço robótico montado em uma plataforma com rodas na cozinha de um escritório. Cá, o robô enfrentou desafios do mundo real, porquê identificar o item correto para colocar no micro-ondas quando apresentado a várias opções.

Através destes testes, os robôs demonstraram com sucesso a sua capacidade de utilizar a incerteza quantificada para tomar decisões ou procurar esclarecimentos, validando assim a utilidade prática deste método.

Implicações e pesquisas futuras

Olhando para o porvir, as implicações desta pesquisa vão muito além das aplicações atuais. A equipe, liderada por Majumdar e pelo estudante Allen Ren, está explorando porquê essa abordagem pode ser aplicada a problemas mais complexos de percepção de robôs e IA. Isto inclui cenários em que os robôs precisam combinar informações de visão e linguagem para tomar decisões, diminuindo ainda mais a vazio entre a compreensão robótica e a interação humana.

A pesquisa em curso visa não exclusivamente melhorar a capacidade dos robôs de realizar tarefas com maior precisão, mas também de velejar pelo mundo com uma compreensão semelhante à cognição humana. Esta pesquisa pode terebrar caminho para robôs que não sejam exclusivamente mais eficientes e seguros, mas também mais sintonizados com as demandas diferenciadas dos ambientes humanos.

Você pode encontrar a pesquisa publicada cá.

join the future newsletter Unite AI Mobile Newsletter 1

Artigos relacionados

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button