Tech

MetaGPT: guia completo para o melhor agente de IA disponível no momento

Com Large Language Models (LLMs) porquê ChatGPT, a OpenAI testemunhou um aumento na adoção por empresas e usuários, arrecadando atualmente murado de US$ 80 milhões em receita mensal. De entendimento com um relatório recente do The Information, a empresa sediada em São Francisco está a caminho de atingir US$ 1 bilhão em receita anual.

Da última vez, nos aprofundamos no AutoGPT e no GPT-Engineering, os principais agentes de IA baseados em LLM de código descerrado, projetados para automatizar tarefas complexas. Embora promissores, esses sistemas tinham seu quinhão de problemas: resultados inconsistentes, gargalos de desempenho e limitações no tratamento de demandas multifacetadas. Eles mostram proficiência na geração de código, mas seus recursos geralmente param por aí. Eles não possuem funcionalidades críticas de gerenciamento de projetos, porquê geração de PRD, geração de design técnico e prototipagem de interface API.

Digite MetaGPT – um sistema multiagente que utiliza modelos de linguagem grande da Sirui Hong que funde procedimentos operacionais padronizados (SOPs) com sistemas multiagentes baseados em LLM. Oriente paradigma emergente rompe as limitações existentes dos LLMs na promoção da colaboração eficiente e da desagregação de tarefas em aplicações complexas do mundo real.

A formosura do MetaGPT está na sua estruturação. Ele capitaliza técnicas de metaprogramação para manipular, indagar e transformar código em tempo real. O objectivo? Atualizar uma arquitetura de software expedito e maleável que possa se conciliar a tarefas de programação dinâmicas.

Desenvolvimento expedito

Os SOPs atuam porquê uma metafunção cá, coordenando agentes para gerar código involuntariamente com base em entradas definidas. Em termos simples, é porquê se você tivesse transformado uma equipe altamente coordenada de engenheiros de software em um sistema de software inteligente e adaptável.

Compreendendo a estrutura MetaGPT

Estrutura MetaGPT

Estrutura MetaGPT (https://arxiv.org/pdf/2308.00352.pdf)

Camadas fundamentais e de colaboração

A arquitetura do MetaGPT é dividida em duas camadas: a Estrato de Componentes Fundamentais e a Estrato de Colaboração.

  1. Estrato de Componentes Fundamentais: esta categoria concentra-se nas operações individuais dos agentes e facilita a troca de informações em todo o sistema. Ele apresenta blocos de construção básicos, porquê envolvente, memória, funções, ações e ferramentas. O Envolvente prepara o terreno para espaços de trabalho e vias de informação compartilhados, enquanto a Memória serve porquê registro de dados históricos. As funções encapsulam conhecimentos específicos do domínio, as ações executam tarefas modulares e as ferramentas oferecem serviços comuns. Esta categoria serve essencialmente porquê sistema operacional para os agentes. Mais detalhes sobre porquê eles funcionam juntos estão disponíveis no cláusula ‘Além do ChatGPT; Agente de IA: um novo mundo de trabalhadores
  2. Estrato de colaboração: construída sobre componentes fundamentais, essa categoria gerencia e agiliza os esforços colaborativos de agentes individuais. Ele introduz dois mecanismos: compartilhamento de conhecimento e encapsulamento de fluxos de trabalho.
    • Compartilhamento de conhecimento: Isso atua porquê a cola colaborativa que une os agentes. Os agentes podem armazenar, restaurar e compartilhar informações em diversos níveis, reduzindo assim a redundância e aumentando a eficiência operacional.
    • Encapsulando Fluxos de Trabalho: É cá que os Procedimentos Operacionais Padronizados (POPs) entram em ação. Os SOPs atuam porquê modelos que dividem as tarefas em componentes gerenciáveis. Essas subtarefas são atribuídas aos agentes e seu desempenho é desempenado com resultados padronizados.

MetaGPT também usa “Definições de funções”Para iniciar vários agentes especializados, porquê Gerentes de Resultado, Arquitetos, etc., conforme discutimos supra. Essas funções são caracterizadas por atributos-chave porquê nome, perfil, objetivo, restrições e descrição.

Uma descrição comparativa do SOP de desenvolvimento de software entre MetaGPT e equipe humana do mundo real

https://arxiv.org/pdf/2308.00352.pdf

Outrossim, “Agentes Âncora” fornece orientação específica para a função desses agentes. Por exemplo, a função de um Gerente de Resultado pode ser inicializada com a restrição de “produzir eficientemente um resultado de sucesso”. Os agentes âncora garantem que o comportamento dos agentes esteja desempenado com os objetivos gerais, otimizando assim o desempenho.

Processos Cognitivos em Agentes MetaGPT

MetaGPT pode observar, pensar, refletir e agir. Eles operam por meio de funções comportamentais específicas, porquê _think(), _observe(), _publish_message()etc. Esta modelagem cognitiva prepara os agentes para serem aprendizes ativos que podem se conciliar e evoluir.

  1. Observar: os agentes examinam seu envolvente e incorporam dados importantes em sua memória.
  2. Pense e Reflita: Através de _think() função, os papéis são deliberados antes de empreender ações.
  3. Transmitir mensagens: Agentes usados _publish_message() para compartilhar status atuais de tarefas e registros de ações relacionadas.
  4. Precipitação e Ação do Conhecimento: os agentes avaliam as mensagens recebidas e atualizam seus repositórios internos antes de determinar sobre o próximo curso de ação.
  5. Gestão Estadual: com recursos porquê bloqueio de tarefas e atualização de status, as funções podem processar diversas ações sequencialmente sem interrupção, refletindo a colaboração humana do mundo real.

Mecanismos de revisão de código para MetaGPT

A revisão de código é um componente crítico no ciclo de vida de desenvolvimento de software, mas está ausente em vários frameworks populares. Tanto o MetaGPT quanto o AgentVerse oferecem suporte a recursos de revisão de código, mas o MetaGPT vai um passo além. Ele também incorpora a realização de pré-compilação, o que auxilia na detecção precoce de erros e, posteriormente, eleva a qualidade do código. Dada a natureza iterativa da codificação, esse recurso não é unicamente um complemento, mas um requisito para qualquer estrutura de desenvolvimento madura.

Experimentos quantitativos realizados em diversas tarefas revelaram que o MetaGPT superou seus equivalentes em quase todos os cenários. Pass@1 é uma medida da capacidade da estrutura de gerar código preciso em uma única iteração. Esta métrica oferece um revérbero mais realista da utilidade de uma estrutura num envolvente prático. Uma taxa Pass@1 mais subida significa menos depuração e mais eficiência, impactando diretamente os ciclos e custos de desenvolvimento. Quando comparado a outras ferramentas avançadas de geração de código, porquê CodeX, CodeT e até mesmo GPT-4, MetaGPT supera o Shopping. A capacidade do quadro para obter um 81,7% para 82,3% Taxa Pass@1 nos benchmarks HumanEval e MBPP.

Comparando MBPP e HumanEval Metrics b/w MetaGPT e outros modelos líderes (https://arxiv.org/pdf/2308.00352.pdf)

Comparando MBPP e HumanEval Metrics b/w MetaGPT e outros modelos líderes (https://arxiv.org/pdf/2308.00352.pdf)

A estrutura também utiliza menos tokens e recursos computacionais, alcançando uma subida taxa de sucesso por uma fração dos custos tradicionais de engenharia de software. Os dados indicaram um dispêndio médio de unicamente US$ 1,09 por projeto com MetaGPT, que é unicamente uma fração do que um desenvolvedor cobraria pela mesma tarefa.

Etapas para instalar localmente o MetaGPT em seu sistema

NPM, instalação do Python

  1. Verifique e instale o NPM: Em primeiro lugar, certifique-se de que o NPM esteja instalado em seu sistema. Caso contrário, você precisará instalar o node.js. Para verificar se você possui npm, execute levante comando em seu terminal: npm --version. Se você vir um número de versão, estará pronto.
  2. Para instalar mermaid-jsuma submissão do MetaGPT, execute: sudo npm install -g @mermaid-js/mermaid-cli ou npm install -g @mermaid-js/mermaid-cli
  3. Verifique a versão do Python: certifique-se de ter o Python 3.9 ou superior. Para verificar sua versão do Python, abra seu terminal e digite: python --version. Se você não estiver atualizado, baixe a versão mais recente no site solene do Python.
  4. Clonar repositório MetaGPT: Comece clonando o repositório MetaGPT GitHub usando o comando git clone https://github.com/geekan/metagpt. Certifique-se de ter o Git instalado em seu sistema para isso. Se não, visite cá.
  5. Navegue até o diretório: Uma vez clonado, navegue até o diretório MetaGPT usando o comando cd metagpt.
  6. Instalação: Execute o script de forma do Python para instalar o MetaGPT com o comando python setup.py install.
  7. Crie um aplicativo: execute python startup.py "ENTER-PROMPT" --code_review True

Reparo:

  • Seu novo projeto agora deve estar no workspace/ diretório.
  • --code_review True permitirá que o protótipo GPT execute operações extras que garantirão que o código seja executado com precisão, mas observe que custará mais.
  • Se você encontrar um erro de permissão durante a instalação, tente executar python setup.py install --user porquê uma escolha.
  • Para entrada a lançamentos específicos e mais detalhes, visite a página solene de lançamentos do MetaGPT GitHub: MetaGPT Releases.

Instalação do Docker

Para quem prefere conteinerização, o Docker simplifica o processo:

  • Extraia a imagem do Docker: Baixe a imagem solene do MetaGPT e prepare o registro de forma:

docker pull metagpt/metagpt:v0.3.1

mkdir -p /opt/metagpt/{config,workspace}

docker run --rm metagpt/metagpt:v0.3.1 cat /app/metagpt/config/config.yaml > /opt/metagpt/config/key.yaml
vim /opt/metagpt/config/key.yaml

  • Execute o contêiner MetaGPT: execute o contêiner com o seguinte comando:

docker run --rm --privileged

-v /opt/metagpt/config/key.yaml:/app/metagpt/config/key.yaml

-v /opt/metagpt/workspace:/app/metagpt/workspace

metagpt/metagpt:v0.3.1

python startup.py "Create a simple and interactive CLI based rock, paper and scissors game" --code_review True

Configurando MetaGPT com sua chave de API OpenAI

Posteriormente a forma inicial, você precisará integrar o MetaGPT com sua chave de API OpenAI. Cá estão as etapas para fazer isso:

  1. Localize ou gere sua chave OpenAI: você pode encontrar essa chave em seu quadro OpenAI nas configurações da API.
  2. Defina a chave API: você tem a opção de colocar a chave de API em config/key.yaml, config/config.yamlou defina-o porquê uma variável de envolvente (env). A ordem de precedência é config/key.yaml > config/config.yaml > env.
  3. Para definir a chave, navegue até config/key.yaml e substitua o texto do espaço reservado pela sua chave OpenAI: OPENAI_API_KEY: "sk-..."

Lembre-se de proteger sua chave API OpenAI. Nunca envie-o para um repositório público ou compartilhe-o com pessoas não autorizadas.

Ilustração de caso de uso

Apresentei porquê objetivo desenvolver um jogo de pedra, papel e tesoura fundamentado em CLI, e o MetaGPT executou a tarefa com sucesso.

Inferior está um vídeo que mostra a realização real do código do jogo gerado.

Realização de mostra MetaGPT

MetaGPT forneceu um documento de design de sistema em Markdown – uma linguagem de marcação ligeiro comumente usada. Oriente registro Markdown estava repleto de diagramas UML, oferecendo assim uma visão granular do projeto arquitetônico. Outrossim, as especificações da API foram detalhadas com métodos HTTP, endpoints, objetos de solicitação/resposta e códigos de status

Saída MetaGPT - Projeto do Sistema

Saída MetaGPT – Markdown de design do sistema

O diagrama de classes detalha os atributos e métodos de nosso Game classe, fornecendo uma abstração fácil de entender. Ele ainda visualiza o fluxo de chamadas do programa, transformando efetivamente ideias abstratas em etapas tangíveis.

Isso não unicamente reduz significativamente a sobrecarga manual no planejamento, mas também acelera o processo de tomada de decisão, garantindo que seu pipeline de desenvolvimento permaneça expedito. Com o MetaGPT, você não está unicamente automatizando a geração de código, mas também o planejamento inteligente de projetos, proporcionando assim uma vantagem competitiva no desenvolvimento rápido de aplicativos.

Peroração: MetaGPT – Revolucionando o Desenvolvimento de Software

MetaGPT redefine o cenário da IA ​​generativa e do desenvolvimento de software, oferecendo uma combinação perfeita de automação inteligente e gerenciamento expedito de projetos. Superando em muito as capacidades dos modelos ChatGPT, AutoGPT e LangChain tradicionais, ele se destaca na desagregação de tarefas, geração eficiente de código e planejamento de projetos. Saiba mais em

Cá estão as principais conclusões deste cláusula:

  1. O poder da metaprogramação: Ao empregar metaprogramação, o MetaGPT fornece uma estrutura de software expedito e adaptável. Ele transcende a funcionalidade restrita das ferramentas legadas e introduz uma abordagem transformadora que lida não unicamente com a codificação, mas também com aspectos de gerenciamento de projetos e tomada de decisões.
  2. Arquitetura de duas camadas: Com suas camadas fundamentais e colaborativas, o MetaGPT cria efetivamente um ecossistema sinérgico onde os agentes podem trabalhar de forma coesa, semelhante a uma equipe de software gerenciada por especialistas.
  3. Revisão de código otimizada: Além de unicamente gerar código, o MetaGPT oferece recursos de realização de pré-compilação, que é essencialmente um sistema de alerta precoce para erros. Isso não unicamente economiza tempo de depuração, mas também garante a qualidade do código.
  4. Agentes Cognitivos: Os agentes inteligentes do MetaGPT, repletos de funções cognitivas porquê _observe(), _think() e _publish_message(), evoluem e se adaptam, garantindo que sua solução de software não seja unicamente codificada, mas também 'inteligente'.
  5. Instalação e implantação: Ilustramos que o MetaGPT pode ser facilmente configurado, quer você prefira uma instalação sítio via npm e Python ou conteinerização via Docker.

join the future newsletter Unite AI Mobile Newsletter 1

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button