Microsoft lança Phi-3: modelos poderosos de IA aberta que oferecem desempenho superior em tamanhos pequenos
![Alex Mc A futuristic glowing small AI brain made of intricate 20bac053 6d48 41b1 866b 6e2f33b27dfe 1](https://i1.wp.com/www.unite.ai/wp-content/uploads/2024/04/Alex_Mc_A_futuristic_glowing_small_AI_brain_made_of_intricate_20bac053-6d48-41b1-866b-6e2f33b27dfe_1-1000x600.png?w=780&resize=780,470&ssl=1)
A Microsoft lançou o Phi-3, uma nova família de modelos de linguagem pequena (SLMs) que visa oferecer alto desempenho e economia em aplicações de IA. Esses modelos mostraram resultados sólidos em benchmarks de compreensão linguística, raciocínio, codificação e matemática quando comparados a modelos de tamanhos semelhantes e maiores. O lançamento do Phi-3 expande as opções disponíveis para desenvolvedores e empresas que buscam aproveitar a IA e ao mesmo tempo equilibrar eficiência e custo.
Família e disponibilidade do modelo Phi-3
O primeiro modelo da linha Phi-3 é o Phi-3-mini, um modelo de parâmetro de 3,8B agora disponível no Azure AI Studio, Hugging Face e Ollama. O Phi-3-mini vem com ajuste de instrução, permitindo que ele seja usado “pronto para uso”, sem muitos ajustes finos. Ele apresenta uma janela de contexto de até 128 mil tokens, a mais longa em sua classe de tamanho, permitindo o processamento de entradas de texto maiores sem sacrificar o desempenho.
Para otimizar o desempenho em configurações de {hardware}, o Phi-3-mini foi ajustado para ONNX Runtime e GPUs NVIDIA. A Microsoft planeja expandir a família Phi-3 em breve com o lançamento do Phi-3-small (parâmetros 7B) e Phi-3-medium (parâmetros 14B). Esses modelos adicionais fornecerão uma gama mais ampla de opções para atender a diversas necessidades e orçamentos.
Imagem: Microsoft
Desempenho e desenvolvimento do Phi-3
A Microsoft relata que os modelos Phi-3 demonstraram melhorias significativas de desempenho em relação a modelos do mesmo tamanho e modelos ainda maiores em vários benchmarks. Segundo a empresa, o Phi-3-mini superou modelos com o dobro de seu tamanho em tarefas de compreensão e geração de linguagem, enquanto o Phi-3-small e o Phi-3-medium superaram modelos muito maiores, como o GPT-3.5T, em certos avaliações.
A Microsoft afirma que o desenvolvimento dos modelos Phi-3 seguiu os princípios e padrões de IA Responsável da empresa, que enfatizam responsabilidade, transparência, justiça, confiabilidade, segurança, privacidade, proteção e inclusão. Os modelos passaram por treinamento de segurança, avaliações e equipes vermelhas para garantir a adesão às práticas responsáveis de implantação de IA.
![the phi 3 small language models with big potential 1](https://www.unite.ai/wp-content/uploads/2024/04/the-phi-3-small-language-models-with-big-potential-1-300x169.webp)
Imagem: Microsoft
Potenciais aplicações e capacidades do Phi-3
A família Phi-3 foi projetada para se destacar em cenários onde os recursos são limitados, a baixa latência é essencial ou a relação custo-benefício é uma prioridade. Esses modelos têm o potencial de permitir inferência no dispositivo, permitindo que aplicativos alimentados por IA sejam executados com eficiência em uma ampla variedade de dispositivos, incluindo aqueles com capacidade computacional limitada. O tamanho menor dos modelos Phi-3 também pode tornar o ajuste fino e a personalização mais acessíveis para as empresas, permitindo-lhes adaptar os modelos aos seus casos de uso específicos sem incorrer em custos elevados.
Em aplicações onde tempos de resposta rápidos são críticos, os modelos Phi-3 oferecem uma solução promissora. Sua arquitetura otimizada e processamento eficiente podem permitir a geração rápida de resultados, melhorando as experiências do usuário e abrindo possibilidades para interações de IA em tempo actual. Além disso, os fortes recursos de raciocínio e lógica do Phi-3-mini o tornam adequado para tarefas analíticas, como análise de dados e geração de insights.