Tech

Como a visão periférica da IA ​​poderia melhorar a tecnologia e a segurança

A visão periférica, um paisagem frequentemente esquecido da visão humana, desempenha um papel fundamental na forma porquê interagimos e compreendemos o que nos rodeia. Permite-nos detectar e reconhecer formas, movimentos e sinais importantes que não estão na nossa traço direta de visão, expandindo assim o nosso campo de visão para além da dimensão medial focada. Esta capacidade é crucial para as tarefas diárias, desde velejar em ruas movimentadas até responder a movimentos bruscos nos esportes.

No Instituto de Tecnologia de Massachusetts (MIT), os investigadores estão a aprofundar-se no domínio da perceptibilidade sintético com uma abordagem inovadora, com o objetivo de dotar os modelos de IA de uma forma simulada de visão periférica. O seu trabalho inovador procura colmatar uma vazio significativa nas actuais capacidades de IA, que, ao contrário dos humanos, carecem da faculdade de percepção periférica. Esta limitação nos modelos de IA restringe o seu potencial em cenários onde a detecção periférica é forçoso, porquê em sistemas de meio autónoma ou em ambientes complexos e dinâmicos.

Compreendendo a visão periférica em IA

A visão periférica em humanos é caracterizada pela nossa capacidade de perceber e interpretar informações nos periferia do nosso foco visual direto. Embora esta visão seja menos detalhada do que a visão medial, é altamente sensível ao movimento e desempenha um papel crítico ao alertar-nos sobre potenciais perigos e oportunidades no nosso envolvente.

Em contraste, os modelos de IA têm tradicionalmente lutado com levante paisagem da visão. Os atuais sistemas de visão computacional são projetados principalmente para processar e investigar imagens que estão diretamente em seu campo de visão, semelhante à visão medial em humanos. Isto deixa um ponto cego significativo na percepção da IA, mormente em situações em que a informação periférica é sátira para tomar decisões informadas ou reagir a mudanças imprevistas no envolvente.

A investigação conduzida pelo MIT aborda esta vazio crucial. Ao incorporar uma forma de visão periférica em modelos de IA, a equipa pretende produzir sistemas que não só vejam, mas também interpretem o mundo de uma forma mais semelhante à visão humana. Leste progresso tem o potencial de melhorar as aplicações de IA em vários campos, desde a segurança viatura até à robótica, e pode até contribuir para a nossa compreensão do processamento visual humano.

A abordagem do MIT

Para conseguir isso, eles reinventaram a forma porquê as imagens são processadas e percebidas pela IA, aproximando-as da experiência humana. Mediano para sua abordagem é o uso de um padrão de ladrilho de textura modificado. Os métodos tradicionais muitas vezes dependem simplesmente de desfocar as bordas das imagens para imitar a visão periférica. No entanto, os investigadores do MIT reconheceram que levante método é insuficiente na representação precisa da complexa perda de informação que ocorre na visão periférica humana.

Para resolver isso, eles refinaram o padrão de textura lado a lado, uma técnica inicialmente projetada para emular a visão periférica humana. Leste padrão modificado permite uma transformação de imagens com mais nuances, capturando a transição da perda de detalhes que ocorre à medida que o olhar se move do meio para a periferia.

Uma secção forçoso deste esforço foi a geração de um conjunto de dados abrangente, projetado especificamente para treinar modelos de aprendizagem de máquina no reconhecimento e versão de informações visuais periféricas. Leste conjunto de dados consiste em uma ampla gama de imagens, cada uma meticulosamente transformada para exibir vários níveis de fidelidade visual periférica. Ao treinar modelos de IA com levante conjunto de dados, os pesquisadores pretendiam incutir neles uma percepção mais realista das imagens periféricas, semelhante ao processamento visual humano.

Descobertas e implicações

Ao treinar modelos de IA com levante novo conjunto de dados, a equipe do MIT embarcou em uma confrontação meticulosa do desempenho desses modelos com as capacidades humanas em tarefas de detecção de objetos. Os resultados foram esclarecedores. Embora os modelos de IA demonstrassem uma capacidade melhorada de detectar e reconhecer objectos na periferia, o seu desempenho ainda não estava ao nível das capacidades humanas.

Uma das descobertas mais surpreendentes foram os padrões de desempenho distintos e as limitações inerentes da IA ​​neste contexto. Ao contrário dos humanos, o tamanho dos objetos ou a quantidade de confusão visual não tiveram impacto significativo no desempenho dos modelos de IA, sugerindo uma diferença fundamental na forma porquê a IA e os humanos processam a informação visual periférica.

Essas descobertas têm implicações profundas para várias aplicações. No domínio da segurança viatura, os sistemas de IA com visão periférica melhorada poderiam reduzir significativamente os acidentes, detectando perigos potenciais que estão fora da traço direta de visão dos condutores ou sensores. Esta tecnologia também poderia desempenhar um papel fundamental na compreensão do comportamento humano, particularmente na forma porquê processamos e reagimos aos estímulos visuais na nossa periferia.

Aliás, esse progresso é promissor para a melhoria das interfaces do usuário. Ao compreender porquê a IA processa a visão periférica, designers e engenheiros podem desenvolver interfaces mais intuitivas e responsivas que se alinhem melhor com a visão humana oriundo, criando assim sistemas mais fáceis de usar e eficientes.

Em origem, o trabalho dos investigadores do MIT não só marca um passo significativo na evolução da visão da IA, mas também abre novos horizontes para melhorar a segurança, compreender a cognição humana e melhorar a interação do utilizador com a tecnologia.

Ao preencher a vazio entre a percepção humana e a da máquina, esta pesquisa abre uma infinidade de possibilidades no progresso da tecnologia e melhorias de segurança. As implicações deste estudo estendem-se a vários campos, prometendo um horizonte onde a IA poderá não só ver mais pessoas porquê nós, mas também compreender e interagir com o mundo de uma forma mais matizada e sofisticada.

Você pode encontrar a pesquisa publicada cá.

Unite AI Mobile Newsletter 1

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button