Microsoft prepara recurso Copilot Imaginative and prescient AI para o navegador Edge

A Microsoft está preparando um lançamento mais amplo do Copilot Imaginative and prescient, uma ferramenta de IA que se integra diretamente ao navegador Edge, com o objetivo de mudar a forma como as pessoas interagem com an internet. Apresentado inicialmente pelo Copilot Labs em outubro, o assistente vai além dos simples recursos do chatbot, compreendendo texto e imagens na tela do usuário.

Think about-o guiando você por uma comparação complexa de destinos de viagem, fazendo recomendações sem abrir abas extras. A empresa enfatiza que o Copilot Imaginative and prescient opera sob rígidos controles de privacidade, excluindo todos os dados da sessão ao sair para evitar o uso indevido de informações.

IA contextual para assistência na Internet sem esforço

Ao contrário dos modelos tradicionais de chat de IA, o Copilot Imaginative and prescient fornece insights com base no que vê, quer você esteja comprando dispositivos tecnológicos ou planejando refeições. Precisa substituir um ingrediente enquanto segue uma receita? A IA pode sugerir alternativas adequadas. Ele foi projetado para observar, não para invadir, ativando apenas com permissão explícita do usuário. Além disso, ele obedece a restrições de conteúdo, evitando páginas protegidas por acesso pago ou aquelas marcadas como privadas pelos proprietários de websites. Este modelo de “assistência e observação” prioriza o uso ético da IA e respeita os direitos de propriedade digital.

Lançado em outubro de 2024, o Copilot Labs serve como ambiente controlado da Microsoft para testar novas ferramentas de IA para o Microsoft Copilot. É onde o Copilot Imaginative and prescient e outras inovações como o Suppose Deeper são ajustados com base no suggestions do usuário. O Suppose Deeper, disponível para assinantes do Copilot Professional por meio de um botão 'Suppose Deeper' ao usar o Copilot, aborda questões complexas, como problemas matemáticos avançados ou estratégia financeira, operando dentro de limites para garantir um desempenho estável em regiões selecionadas, incluindo os EUA e o Reino Unido. Ao fazer experiências nesta sandbox, a Microsoft coleta dados do mundo actual para refinar seus recursos de IA antes de um lançamento mais amplo.

Baseando-se em marcos anteriores de IA

A Microsoft vem investindo em IA de visão há algum tempo, exemplificado pelo modelo Florence-2 anunciado em junho de 2024. Florence-2 é um modelo de linguagem de visão de uso geral projetado para tarefas como detecção e segmentação de objetos. Ele usa uma abordagem baseada em prompts, destacando-se até mesmo em modelos maiores, como o modelo de linguagem visible Flamingo do Google DeepMind. O treinamento envolveu um conjunto diversificado de mais de 5 bilhões de pares imagem-texto, abrangendo vários idiomas para aumentar sua versatilidade. Os pesquisadores afirmaram que o modelo alcança melhorias notáveis em eficiência e precisão, beneficiando aplicações desde a segmentação semântica até o embasamento visible.

Outro marco importante para a Microsoft foi o lançamento do GigaPath AI Imaginative and prescient Mannequin em maio, focado em patologia digital. Desenvolvido em parceria com a Universidade de Washington e o Windfall Well being System, este modelo utiliza aprendizagem auto-supervisionada avançada para analisar slides de patologia em gigapixels. O GigaPath já apresentou resultados superiores em tarefas como subtipagem de câncer e análise de tumores, validados com dados de iniciativas como o Atlas do Genoma do Câncer. O GigaPath marca um passo crítico na medicina de precisão, permitindo uma melhor análise de doenças com base em características genéticas.

Lutas de IA: novos estudos levantam sinais de alerta

Nem todos os modelos de IA correspondem às expectativas. Um estudo recente de outubro expôs falhas graves em modelos de linguagem de visão como o GPT-4o da OpenAI, que teve um desempenho fraco nos problemas de Bongard – quebra-cabeças visuais que exigem a identificação de padrões básicos. Nos testes, o GPT-4o resolveu apenas 21% das questões abertas e mostrou apenas uma melhoria modesta nos formatos de múltipla escolha. Os pesquisadores destacaram que essas deficiências revelam problemas mais profundos com a capacidade dos modelos atuais de generalizar e aplicar o raciocínio visible.

Lutas semelhantes foram observadas na transcrição de IA. O Whisper da OpenAI, por exemplo, foi criticado por frases “alucinantes”, o que se torna um grande problema em ambientes como o da saúde. Um estudo de junho da Universidade Cornell relatou que a taxa de alucinações do Whisper period superior a 1%, um risco em ambientes onde erros de transcrição podem ser prejudiciais. As preocupações com a privacidade também prevalecem, visto que o Whisper exclui os arquivos de áudio originais após a transcrição, não deixando nenhuma maneira de verificar a precisão.

Competindo em um mercado lotado de IA

Os avanços da Microsoft ocorrem no momento em que gigantes da tecnologia como Google, Meta e OpenAI continuam a refinar seus modelos de IA. No entanto, com recursos como o Copilot Imaginative and prescient, a Microsoft espera obter vantagem ao priorizar a privacidade e a funcionalidade em tempo actual. A competição é intensa e cada jogador ultrapassa limites de maneiras únicas.