Midjourney V6 vs. V6.1: Um passo na direção certa

Há uma razão pela qual Midjourney tem sido o assunto da cidade no mundo da IA. Às vezes é porque eles estão mais uma vez envolvidos em discussões sobre deepfakes. Mas hoje, é para algo bom: eles finalmente lançaram uma atualização para seu modelo V6 chamado, bem, o que mais senão Midjourney V6.1.

E acredite em mim, isso muda tudo.

Então, o que há de novo no Midjourney V6.1? Bem, a equipe se concentrou em melhorar a criatividade do modelo e tornar as imagens ainda mais coerentes e realistas. Estou usando há semanas e, deixe-me dizer, pode ser uma mudança sutil, mas faz uma grande diferença na qualidade da saída.

Ah, e sim, eles também adicionaram um recurso muito bacana que os usuários estavam implorando há muito tempo.

Mas não acredite apenas na minha palavra. Vamos mergulhar e ver como o Midjourney V6.1 se compara ao seu antecessor em diferentes categorias de imagens.

O que é Midjourney?

Sejamos honestos — se você tem algum conhecimento sobre IA, provavelmente já ouviu falar dela No meio da jornada. Este é um modelo de geração de imagens de IA que pode criar qualquer foto, desde obras de arte até imagens reais (bem, algo que se pareça com uma, pelo menos). Lançado em 2021, o modelo mais recente da Midjourney é o V6.1, que estamos analisando hoje e comparando com o V6.

image 10image 10

Para uma visão geral mais completa, aqui está nossa análise do Midjourney de um ano atrás. É um ótimo guia inicial se você estiver procurando se familiarizar com o aplicativo.

O que há de novo no Midjourney V6.1?

Como não é realmente um modelo novo, mas sim uma atualização do V6, esta nova versão focou em melhorar a criatividade e a coerência de imagem do modelo pré-existente. Isso significa menos dedos faltando (ou extras), imagens mais realistas, melhor criatividade e tempo de resposta mais rápido. A equipe também colocou ênfase em melhorar a geração de texto, que revisaremos em breve.

Aqui está um resumo completo de todas as melhorias que eles fizeram:

Desde seu lançamento há três semanas, a Midjourney também lançou um novo recurso em seu aplicativo internet para V6.1 — um editor melhor. Então, o que exatamente o torna melhor?

Na época em que o Midjourney não tinha um aplicativo internet e só podia ser acessado no Discord, eles já tinham um recurso chamado variação de região. Isso permite que você selecione uma área de uma imagem gerada e o Midjourney cria uma nova versão dela. Veja esta imagem como exemplo:

Digamos que eu não seja realmente um grande fã do lago. Aqui está como eu o mudaria usando o bot do Discord do Midjourney.

A partir daí, você pode selecionar a região que deseja alterar.

Então, você obtém quatro novas versões da sua imagem unique com a região selecionada alterada.

Então, qual é o problema?

O problema com isso é que você não tem realmente nenhum controle sobre as novas imagens. Você não pode alterar o immediate, então você fica preso ao immediate unique e o Midjourney vai continuar gerando novas versões da área selecionada usando qualquer immediate que ele já tenha.

Com o V6.1 e o aplicativo da internet do Midjourney, isso mudou. Agora você pode selecionar a área E altere o immediate unique. Então, por exemplo, aqui está um sapo fofo:

Vamos usar o último. Quando você clicar na imagem, uma barra de ferramentas aparecerá no lado direito. Selecione o botão rotulado “Editor.”

Digamos que eu queira ver a língua dele. Pedido estranho, eu sei. Mas o que posso fazer agora é pressionar o botão “Apagar” acima e selecionar a área da boca. A partir daí, vou apenas mudar o immediate de “Um sapo fofo” para “Um sapo fofo com a língua para fora”.

E agora você não precisa mais se perguntar se o Midjourney pode editar fotos. Aqui está o produto closing:

Comparação entre Midjourney V6 e V6.1: Qualidade de saída

Vamos comparar o Midjourney V6.1 com sua versão anterior usando os mesmos prompts em diferentes categorias.

Retrato (Pessoas, Planos Médios e Longos)

Incitar: retrato, um velho sábio, fotografia de rua de glamour em médio formato, tirada em cinealta, dia, fundo de paisagem urbana, traje de inspiração classic, luzes de rua suaves, superfícies reflexivas, efeito bokeh sutil
Meio da jornada V6 Midjourney V6.1

Ambas ainda me dão uma leve sensação de vale misterioso, mas a versão do V6.1 é muito mais coerente (como eles prometeram). O modelo mais antigo ainda parece actual se você não der zoom, mas quando você dá, você pode ver pequenos problemas com o olho do homem.

Retrato (Pessoas, Fotos em Shut-up)

Incitar: em algum lugar no ano de 1983, uma mulher olhando para a câmera, vista aérea, melancolia, close-up, analógico
Meio da jornada V6 Midjourney V6.1

O rosto da mulher na saída do Midjourney V6 é um pouco suave e escovado demais para o meu gosto. Ele também ignorou a parte do meu immediate onde especifiquei o ângulo de “visão aérea”.

A versão mais recente não fez nenhuma das duas coisas — mostrando maior realismo e compreensão rápida.

Retrato (não humano)

Incitar: Uma árvore bonsai magnólia hiper-realista, iluminação de estúdio, fundo escuro, isolada
Meio da jornada V6 Midjourney V6.1

Acho que ambas são boas imagens, mas se eu fosse criticar, diria que a iluminação no V6 foi um pouco exagerada e não gerou muitas folhas em comparação com flores.

Paisagem

Incitar: cataratas victoria, leica m6, fotografia de paisagem
Meio da jornada V6
Midjourney V6.1

Embora as cores de ambas as imagens sejam suaves até certo ponto, a versão da primeira é um pouco também silenciado para o meu gosto. A versão 6.1 tem uma gradação de cores mais equilibrada.

Foto de filme de ação ao vivo

Incitar: uma cena de um filme do início dos anos 2000, um homem em seu quarto lendo um livro, objetos de fundo coloridos, elementos caprichosos, no estilo de wes anderson, simétrico
Meio da jornada V6
Midjourney V6.1
Incitar: uma cena de um filme de super-herói, uma super-heroína que pode controlar o fogo, cenário de rua, no estilo dos estúdios Marvel
Meio da jornada V6
Midjourney V6.1
Incitar: uma cena de um filme japonês dos anos 1960, um samurai de pé sobre um inimigo derrotado, no estilo de Akira Kurosawa
Meio da jornada V6
Midjourney V6.1

Além da criatividade, o que posso dizer é que o V6.1 segue o immediate mais de perto, já que suas saídas estão mais próximas dos diretores que mencionei. E o que diabos está acontecendo com aqueles três pés da primeira imagem?

Foto de filme animado

Incitar: um fantasma e um cachorro brincando de pega-pega, caprichoso, realismo mágico, no estilo de hayao miyazaki, studio ghibli
Meio da jornada V6
Midjourney V6.1

Esta é uma questão de preferência, na verdade — ambas as imagens são boas o suficiente no meu livro. Eu tenho que dar uma ligeira vantagem para Midjourney V6.1 porque parece mais caprichoso. Mas, novamente, essa é apenas minha opinião.

Obras de arte digitais

Incitar: cena de pixel artwork, biblioteca de um feiticeiro, jogo de 8 bits
Meio da jornada V6 Midjourney V6.1
Incitar: manila ao crepúsculo, arte digital, low poly, geométrico, gradientes coloridos, em campos de cores suaves
Meio da jornada V6 Midjourney V6.1
Incitar: um horror sobrenatural desencadeado no cosmos, ilustração de fantasia sombria, litografia, ilustração dos anos 1980, gótico escuro e macabro, larry elmore, lovecraftiano
Meio da jornada V6 Midjourney V6.1

O primeiro mostra menor coerência estrutural no Midjourney V6 porque, sejamos honestos, quem vai colocar uma biblioteca fora de casa? A saída do V6.1 também tem mosaico de pixels mais consistente em comparação aos tamanhos de pixel inconsistentes de sua versão mais antiga.

A segunda comparação mostra mais criatividade na parte do Midjourney V6.1, na minha opinião. Ele não apenas pegou polígonos e os moldou para parecerem uma cidade — é muito mais intencional e usa bem os contrastes de cores.

E quanto ao terceiro, escolha o seu. Ambos são incríveis.

Conceitos Abstratos

Incitar: uma visualização de esperança
Meio da jornada V6
Midjourney V6.1

Se eu fosse um estudante de arte, eu sentiria que a saída do V6.1 é muito mais interpretável do que a do V6 — que é apenas um monte de glitter com bokeh na minha opinião. Não consigo ver como isso deveria simbolizar o conceito de esperança.

Logotipo (sem texto)

Incitar: um logotipo para uma floricultura, fundo pastel limpo, no estilo de paul rand
Meio da jornada V6 Midjourney V6.1
Incitar: um logotipo para uma destilaria de vinho, fundo escuro e limpo, minimalista, estilo bauhaus
Meio da jornada V6 Midjourney V6.1
Incitar: um logotipo para uma loja de móveis, estilo artwork déco
Meio da jornada V6 Midjourney V6.1

Embora ambos sejam bons, acho que as saídas do Midjourney V6 são um pouco “altas” demais para serem um logotipo. Há coisas demais acontecendo.

Logotipo (com texto)

Incitar: um logotipo para uma floricultura, fundo pastel limpo, no estilo de paul rand
Meio da jornada V6 Midjourney V6.1

É o mesmo problema do anterior: a saída do Midjourney V6 faz muito para ser usada como um logotipo. Quanto à geração de texto, ambos se saíram muito bem ao escrever “Austen's”, mas a versão anterior escreveu fora do centro — então tenho que dar a vantagem ao V6.1.

Você pode usar o Midjourney de graça?

Infelizmente, não. Se você quiser usar o Midjourney, você precisa aproveitar qualquer um dos planos deles, que começam em US$ 10 por mês. Depois que você fizer isso, e digamos que você ficou sem gerações, você pode classificar imagens no website deles e eles lhe darão uma hora de geração grátis em troca.

O que mais?

Midjourney está a todo vapor, e V6.1 é a prova disso. A atualização mais recente é uma prova da dedicação da equipe em expandir os limites do que é possível na arte gerada por IA. E cara, mal posso esperar para ver o que mais está reservado para o resto de 2024, já que eles prometeram a V6.2 ainda este ano.

As melhorias em realismo, coerência e expressão criativa são absolutamente impressionantes. Midjourney V6.1 está levando o jogo de narrativa visible a um nível totalmente novo.

À medida que o mundo da arte de IA continua a evoluir a uma velocidade alucinante, não é DALL-E 3 ou Firefly que está liderando a mudança, mas Midjourney. A cada iteração, eles estão cativando e inspirando criativos em todos os lugares, deixando-nos famintos por mais.

Exit mobile version