Tech

Midjourney tornou-se mais consistente com a referência de personagem

Há alguns dias, recebi uma nova notificação no Discord. Depois de rolar um pouco, descobri que Midjourney acaba de lançar um novo recurso chamado referência de personagem. Não demorei mais do que dois minutos de leitura antes de abrir o bot Midjourney e tentar.

Alerta de spoiler: é muito bom, como tudo em Midjourney. Neste artigo, abordarei o que realmente é referência de personagem, como usá-la, alguns exemplos e minhas ideias gerais sobre o recurso.

O que é referência de personagem e por que é importante

Se você já usa o Midjourney (ou qualquer gerador de imagens de IA) há algum tempo, tenho certeza de que já se familiarizou com suas armadilhas. Além de questões éticas e possíveis abusos, o maior problema com Midjourney é consistência.

Há algumas semanas, esse problema foi parcialmente resolvido graças em grande parte à referência de estilo, onde você pode inserir uma imagem e usá-la como sua própria referência sem extrair um immediate que possa replicá-la. No entanto, a arte da IA ​​tem dois componentes principais: o assunto e o plano de fundo. A inconsistência deste último é abordada pela referência de estilo, mas e o último?

É aí que entra a referência de personagem. Com a referência de personagem, Midjourney pode copiar o assunto de qualquer imagem e usar sua imagem (rosto, roupas, corpo) para seu próximo immediate.

Como usar referência de caracteres

Você precisa preparar duas coisas: seu immediate e uma imagem de referência. Este último deve conter uma visão clara do rosto e de outras características do seu personagem. Depois de ter uma imagem de referência, basta inserir sua URL seguindo o parâmetro “–cref”. Por exemplo, usarei a frase “um homem sentado em um trono” com o rosto de Samuel L. Jackson. Aqui está o que parece:

Serei honesto, algo está errado. No entanto, ainda é muito melhor do que costumava ser antes, quando você usava apenas uma imagem como parte do immediate. Falaremos mais sobre a precisão e qualidade da referência de caracteres, mas por enquanto, vamos passar aos ajustes de parâmetros.

Depois de adicionar o parâmetro –cref, você pode adicionar um “–cw” que ajusta a força do modelo. Midjourney menciona que o valor padrão 100 copia o rosto, o corpo e as roupas de uma pessoa, enquanto o valor 0 segue apenas o rosto. Aqui está um exemplo:

Exemplos de referência de caracteres

Para as imagens a seguir, tenha sempre isso em mente: a primeira será sempre a imagem de referência, e as três próximas imagens serão as saídas do Midjourney usando referência de caractere. Então, sem mais delongas, veja como Midjourney se tornou consistente:

Pessoas reais

Homem

Mulher

Não Humano

Desenho animado

Anime

Pensamentos gerais

É quase estranho o quão precisos são a maioria deles. De uma só vez, Midjourney corrigiu seu problema de inconsistência. Só posso imaginar o quão eficaz isso será quando combinado com seu recurso de referência de estilo.

Direi, porém, que parece ser mais eficaz se o assunto forem pessoas. Ele se esforçou para capturar a essência e a aparência do monstro verde fofo acima, o que o fazia parecer diferente em cada foto.

Ele também tem um pouco de dificuldade com pessoas reais, mas com toda a justiça, Midjourney mencionou que esse recurso funciona melhor com outras imagens de Midjourney. Eles também disseram que o modelo atual provavelmente distorcerá os rostos de pessoas reais, como aconteceu com as imagens de Abraham Lincoln acima.

No geral, esta é uma grande atualização para o Midjourney e mais um passo positivo para se tornar o melhor gerador de imagens de IA indiscutível do mercado.

O resultado ultimate

Enquanto todos os olhos do mundo estão voltados para Sora, Midjourney continua melhorando seu gerador de imagens de IA com atualizações como esta, referência de estilo e Niji. Hoje em dia, outras ferramentas de imagem de IA parecem estagnadas. Depois de alcançarem “bom o suficiente”, eles pararam de fazer alterações drásticas em seu modelo ou de adicionar novos recursos.

Mas Midjourney não é assim.

O V6 da Midjourney continua a melhorar seu já impressionante modelo básico. Eu realmente luto com qualquer outro gerador de imagens de IA que possa alcançar suas capacidades. Quem sabe o que eles vão inventar amanhã? Tudo o que sei com certeza, seja o que for, abordaremos isso aqui no Gold Penguin, fique ligado! Enquanto isso, você pode ler um de nossos muitos artigos do Midjourney como este. Divirta-se!

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button