Tech

Inflexão-2.5: The Powerhouse LLM rivalizando com GPT-4 e Gemini

LifeTechWebMarch 14, 2024

0 6 minutes read

DALL·E 2024 03 13 11.41.33 A 16 9 digital banner featuring a clean and bold design for an article. The image focuses on a large serif font capital letter P next to a smaller

A Inflection AI tem agitado o campo de grandes modelos de linguagem (LLMs) com o recente lançamento do Inflection-2.5, um modelo que compete com os LLMs líderes mundiais, incluindo o GPT-4 da OpenAI e o Gemini do Google.

A rápida ascensão da Inflection AI foi ainda mais alimentada por uma enorme rodada de financiamento de US$ 1,3 bilhão, liderada por gigantes da indústria como Microsoft, NVIDIA e investidores renomados, incluindo Reid Hoffman, Invoice Gates e Eric Schmidt. Este investimento significativo eleva o financiamento whole levantado pela empresa para US$ 1,525 bilhão.

Em colaboração com os parceiros CoreWeave e NVIDIA, a Inflection AI está construindo o maior cluster de IA do mundo, compreendendo 22.000 GPUs NVIDIA H100 Tensor Core sem precedentes. Este colossal poder computacional apoiará o treinamento e a implantação de uma nova geração de modelos de IA em grande escala, permitindo que a Inflection AI ultrapasse os limites do que é possível no campo da IA pessoal.

O trabalho inovador da empresa já produziu resultados notáveis, com o cluster Inflection AI, que atualmente compreende mais de 3.500 GPUs NVIDIA H100 Tensor Core, oferecendo desempenho de última geração no benchmark de código aberto MLPerf. Num envio conjunto com CoreWeave e NVIDIA, o cluster completou a tarefa de treinamento de referência para grandes modelos de linguagem em apenas 11 minutos, solidificando sua posição como o cluster mais rápido neste benchmark.

Essa conquista segue o lançamento do Inflection-1, o grande modelo de linguagem interno (LLM) da Inflection AI, que foi aclamado como o melhor modelo em sua classe de computação. Superando gigantes da indústria como GPT-3.5, LLaMA, Chinchilla e PaLM-540B em uma ampla gama de benchmarks comumente usados para comparar LLMs, o Inflection-1 permite que os usuários interajam com Pi, a IA pessoal do Inflection AI, de uma forma simples e pure. , recebendo informações e conselhos rápidos, relevantes e úteis.

O compromisso da Inflection AI com a transparência e a reprodutibilidade fica evidente no lançamento de um memorando técnico detalhando a avaliação e o desempenho do Inflection-1 em vários benchmarks. O memorando revela que o Inflection-1 supera os modelos na mesma classe de computação, definidos como modelos treinados usando no máximo FLOPs (operações de ponto flutuante) do PaLM-540B.

O sucesso da Inflection-1 e a rápida expansão da infraestrutura de computação da empresa, impulsionada pela substancial rodada de financiamento, destacam a dedicação inabalável da Inflection AI em cumprir sua missão de criar uma IA pessoal para todos. Com a integração do Inflection-1 no Pi, os usuários agora podem experimentar o poder de uma IA pessoal, beneficiando-se de sua personalidade empática, utilidade e padrões de segurança.

Inflexão-2.5

O Inflection-2.5 agora está disponível para todos os usuários do Pi, o assistente pessoal de IA do Inflection AI, em várias plataformas, incluindo an internet (pi.ai), iOS, Android e um novo aplicativo de desktop. Esta integração marca um marco significativo na missão da Inflection AI de criar uma IA pessoal para todos, combinando capacidade bruta com sua personalidade empática e padrões de segurança exclusivos.

Um salto no desempenho O modelo anterior da Inflection AI, Inflection-1, utilizou aproximadamente 4% dos FLOPs (operações de ponto flutuante) de treinamento do GPT-4 e exibiu um desempenho médio de cerca de 72% em comparação com o GPT-4 em vários programas orientados para QI. tarefas. Com o Inflection-2.5, o Inflection AI alcançou um impulso substancial nas capacidades intelectuais do Pi, com foco em codificação e matemática.

O desempenho do modelo nos principais benchmarks do setor demonstra sua habilidade, apresentando mais de 94% do desempenho médio do GPT-4 em diversas tarefas, com ênfase specific na excelência em áreas STEM. Esta conquista notável é uma prova do compromisso da Inflection AI em expandir a fronteira tecnológica, mantendo um foco inabalável na experiência e segurança do usuário.

Proeza em codificação e matemática O Inflection-2.5 brilha em codificação e matemática, demonstrando uma melhoria de mais de 10% no Inflection-1 no BIG-Bench-Laborious, um subconjunto de problemas desafiadores para grandes modelos de linguagem. Dois benchmarks de codificação, MBPP+ e HumanEval+, revelam melhorias massivas em relação ao Inflection-1, solidificando a posição do Inflection-2.5 como uma força a ser reconhecida no domínio da codificação.

No benchmark MBPP+, o Inflection-2.5 supera seu antecessor por uma margem significativa, exibindo um nível de desempenho comparável ao do GPT-4, conforme relatado pelo DeepSeek Coder. Da mesma forma, no benchmark HumanEval+, o Inflection-2.5 demonstra um progresso notável, superando o desempenho do Inflection-1 e aproximando-se do nível do GPT-4, conforme relatado na tabela de classificação do EvalPlus.

Domínio de referência da indústria

res

O Inflection-2.5 se destaca nos benchmarks do setor, apresentando melhorias substanciais em relação ao Inflection-1 no benchmark MMLU e no benchmark GPQA Diamond, conhecido por sua dificuldade de nível especializado. O desempenho do modelo nestes benchmarks sublinha a sua capacidade de lidar com uma ampla gama de tarefas, desde problemas de nível secundário até desafios de nível profissional.

Excelência em exames STEM As proezas do modelo se estendem aos exames STEM, com desempenho destacado no exame de matemática húngaro e no GRE de física. No exame de matemática húngara, o Inflection-2.5 demonstra sua aptidão matemática aproveitando o immediate e a formatação fornecidos, permitindo facilidade de reprodutibilidade.

No Physics GRE, um exame de admissão de pós-graduação em física, o Inflection-2.5 atinge o 85º percentil de participantes humanos em maj@8 (votação majoritária em 8), solidificando sua posição como um candidato formidável no domínio da resolução de problemas de física . Além disso, o modelo aproxima-se da pontuação máxima em maj@32, exibindo a sua capacidade de resolver problemas físicos complexos com precisão notável.

Melhorando a experiência do usuário O Inflection-2.5 não apenas mantém a personalidade e os padrões de segurança característicos do Pi, mas também eleva seu standing como uma IA pessoal versátil e inestimável em diversos tópicos. Desde a discussão de eventos atuais até a busca de recomendações locais, estudo para exames, programação e até conversas casuais, o Pi desenvolvido com Inflection-2.5 promete uma experiência de usuário enriquecida.

Com os poderosos recursos do Inflection-2.5, os usuários estão interagindo com o Pi em uma gama mais ampla de tópicos do que nunca. A capacidade do modelo de lidar com tarefas complexas, combinada com sua personalidade empática e recursos de pesquisa na net em tempo actual, garante que os usuários recebam informações e orientações atualizadas e de alta qualidade.

Adoção e engajamento do usuário O impacto da integração do Inflection-2.5 ao Pi já é evidente nas métricas de sentimento, engajamento e retenção do usuário. A Inflection AI testemunhou uma aceleração significativa no crescimento orgânico de usuários, com um milhão de usuários ativos diários e seis milhões mensais trocando mais de quatro bilhões de mensagens com Pi.

Em média, as conversas com Pi duram 33 minutos, e uma em cada dez dura mais de uma hora por dia. Além disso, aproximadamente 60% das pessoas que interagem com Pi em uma determinada semana retornam na semana seguinte, apresentando maior aderência mensal do que os principais concorrentes na área.

Detalhes técnicos e transparência de referência

Em linha com o compromisso da Inflection AI com a transparência e a reprodutibilidade, a empresa forneceu resultados técnicos abrangentes e detalhes sobre o desempenho do Inflection-2.5 em vários benchmarks do setor.

Por exemplo, na versão corrigida do conjunto de dados MT-Bench, que aborda problemas com soluções de referência incorretas e premissas falhas no conjunto de dados unique, o Inflection-2.5 demonstra desempenho alinhado com as expectativas baseadas em outros benchmarks.

A Inflection AI também avaliou o Inflection-2.5 em HellaSwag e ARC-C, benchmarks de bom senso e científicos relatados por uma ampla gama de modelos, e os resultados mostram um forte desempenho nesses benchmarks saturantes.

É importante observar que, embora as avaliações fornecidas representem o modelo que alimenta o Pi, a experiência do usuário pode variar ligeiramente devido a fatores como o impacto da recuperação da net (não usado nos benchmarks), a estrutura de prompts de poucos disparos e outros diferenças no lado da produção.

Conclusão

O Inflection-2.5 representa um salto significativo no campo de grandes modelos de linguagem, rivalizando com as capacidades de líderes do setor como GPT-4 e Gemini, ao mesmo tempo que utiliza apenas uma fração dos recursos computacionais. Com seu desempenho impressionante em uma ampla gama de benchmarks, especialmente nas áreas STEM, codificação e matemática, o Inflection-2.5 se posicionou como um concorrente formidável no cenário de IA.

A integração do Inflection-2.5 no Pi, o assistente pessoal de IA do Inflection AI, promete uma experiência de usuário enriquecida, combinando capacidade bruta com personalidade empática e padrões de segurança. À medida que a Inflection AI continua a ultrapassar os limites do que é possível com os LLMs, a comunidade de IA antecipa ansiosamente a próxima onda de inovações e avanços desta empresa pioneira.

A abordagem visionária da Inflection AI vai além do mero desenvolvimento de modelos, pois a empresa reconhece a importância do pré-treinamento e do ajuste fino na criação de experiências de IA úteis, seguras e de alta qualidade. Como um estúdio de IA verticalmente integrado, o Inflection AI cuida de todo o processo internamente, desde a ingestão de dados e design de modelo até a infraestrutura de alto desempenho.

join the future newsletter Unite AI Mobile Newsletter 1