Em um anúncio inovador, Liquid AI, um spin-off do MIT, apresentou sua primeira série de Liquid Basis Fashions (LFMs). Esses modelos, projetados a partir de princípios básicos, estabelecem uma nova referência no espaço de IA generativa, oferecendo desempenho incomparável em diversas escalas. Os LFMs, com sua arquitetura inovadora e recursos avançados, estão preparados para desafiar os modelos de IA líderes do setor, incluindo o ChatGPT.
A Liquid AI foi fundada por uma equipe de pesquisadores do MIT, incluindo Ramin Hasani, Mathias Lechner, Alexander Amini e Daniela Rus. Com sede em Boston, Massachusetts, a missão da empresa é criar sistemas de IA de uso geral capazes e eficientes para empresas de todos os tamanhos. A equipe foi originalmente pioneira em redes neurais líquidas, uma classe de modelos de IA inspirados na dinâmica do cérebro, e agora pretende expandir as capacidades dos sistemas de IA em todas as escalas, desde dispositivos de ponta até implantações de nível empresarial.
O que são modelos de base líquida (LFMs)?
Os Liquid Basis Fashions representam uma nova geração de sistemas de IA que são altamente eficientes tanto no uso de memória quanto no poder computacional. Construídos com base em sistemas dinâmicos, processamento de sinais e álgebra linear numérica, esses modelos são projetados para lidar com vários tipos de dados sequenciais – como texto, vídeo, áudio e sinais – com precisão notável.
A Liquid AI desenvolveu três modelos de linguagem principais como parte deste lançamento:
- LFM-1B: um modelo denso com 1,3 bilhão de parâmetros, otimizado para ambientes com recursos limitados.
- LFM-3B: um modelo de 3,1 bilhões de parâmetros, perfect para cenários de implantação de borda, como aplicativos móveis.
- LFM-40B: um modelo de mistura de especialistas (MoE) de 40,3 bilhões de parâmetros projetado para lidar com tarefas complexas com desempenho excepcional.
Esses modelos já demonstraram resultados de última geração nos principais benchmarks de IA, tornando-os um concorrente formidável dos modelos de IA generativos existentes.
Desempenho de última geração
Os LFMs da Liquid AI oferecem o melhor desempenho da categoria em vários benchmarks. Por exemplo, LFM-1B supera os modelos baseados em transformadores em sua categoria de tamanho, enquanto LFM-3B compete com modelos maiores, como as séries Phi-3.5 da Microsoft e Llama da Meta. O LFM-40B O modelo, apesar de seu tamanho, é eficiente o suficiente para rivalizar com modelos com contagens de parâmetros ainda maiores, oferecendo um equilíbrio único entre desempenho e eficiência de recursos.
Alguns destaques do desempenho do LFM incluem:
- LFM-1B: Domina benchmarks como MMLU e ARC-C, estabelecendo um novo padrão para modelos de parâmetros 1B.
- LFM-3B: Supera modelos como Phi-3.5 e Gemma 2 do Google em eficiência, mantendo um pequeno consumo de memória, tornando-o perfect para aplicativos móveis e de IA de ponta.
- LFM-40B: A arquitetura MoE deste modelo oferece desempenho comparável a modelos maiores, com 12 bilhões de parâmetros ativos a qualquer momento.
Uma nova period na eficiência da IA
Um desafio significativo na IA moderna é o gerenciamento da memória e da computação, especialmente ao trabalhar com tarefas de contexto longo, como resumo de documentos ou interações de chatbot. Os LFMs se destacam nesta área ao compactar eficientemente os dados de entrada, resultando na redução do consumo de memória durante a inferência. Isso permite que os modelos processem sequências mais longas sem exigir atualizações caras de {hardware}.
Por exemplo, LFM-3B oferece um Comprimento do contexto do token de 32k—tornando-o um dos modelos mais eficientes para tarefas que exigem o processamento simultâneo de grandes quantidades de dados.
Uma Arquitetura Revolucionária
Os LFMs são construídos em uma estrutura arquitetônica única, desviando-se dos modelos tradicionais de transformadores. A arquitetura é centrada em operadores lineares adaptativos, que modulam a computação com base nos dados de entrada. Essa abordagem permite que a Liquid AI otimize significativamente o desempenho em várias plataformas de {hardware}, incluindo {hardware} NVIDIA, AMD, Cerebras e Apple.
O espaço de design para LFMs envolve uma nova mistura de mistura de tokens e estruturas de mixagem de canais que melhoram a forma como o modelo processa os dados. Isto leva a capacidades superiores de generalização e raciocínio, particularmente em tarefas de contexto longo e aplicações multimodais.
Expandindo a fronteira da IA
Liquid AI tem grandes ambições para LFMs. Além dos modelos de linguagem, a empresa está trabalhando na expansão de seus modelos básicos para suportar diversas modalidades de dados, incluindo vídeo, áudio e dados de séries temporais. Esses avanços permitirão que os LFMs se expandam em vários setores, como serviços financeiros, biotecnologia e eletrônicos de consumo.
A empresa também está focada em contribuir para a comunidade de ciência aberta. Embora os modelos em si não sejam de código aberto no momento, a Liquid AI planeja divulgar resultados de pesquisas, métodos e conjuntos de dados relevantes para a comunidade mais ampla de IA, incentivando a colaboração e a inovação.
Acesso antecipado e adoção
Atualmente, a Liquid AI oferece acesso antecipado aos seus LFMs por meio de várias plataformas, incluindo Liquid Playground, Lambda (Chat UI e API) e Perplexity Labs. As empresas que buscam integrar sistemas de IA de ponta em suas operações podem explorar o potencial dos LFMs em diferentes ambientes de implantação, desde dispositivos de ponta até soluções locais.
A abordagem de ciência aberta da Liquid AI incentiva os primeiros usuários a compartilhar suas experiências e insights. A empresa está buscando ativamente suggestions para refinar e otimizar seus modelos para aplicações do mundo actual. Desenvolvedores e organizações interessadas em fazer parte desta jornada podem contribuir para os esforços de crimson teaming e ajudar a Liquid AI a melhorar seus sistemas de IA.
Conclusão
O lançamento dos Liquid Basis Fashions marca um avanço significativo no cenário de IA. Com foco na eficiência, adaptabilidade e desempenho, os LFMs estão preparados para remodelar a forma como as empresas abordam a integração de IA. À medida que mais organizações adotam esses modelos, a visão da Liquid AI de sistemas de IA escaláveis e de uso geral provavelmente se tornará a pedra angular da próxima period da inteligência synthetic.
Se você estiver interessado em explorar o potencial dos LFMs para sua organização, a Liquid AI convida você a entrar em contato e se juntar à crescente comunidade de pioneiros que moldam o futuro da IA.
Para obter mais informações, visite o website oficial da Liquid AI e comece a experimentar LFMs hoje mesmo.