Tech

Sora e Midjourney comparados usando o mesmo prompt (AI Video vs Pictures)

Já se passaram meses desde o sinistro de liderança na OpenAI. Depois que a poeira baixou, as pessoas esperaram ansiosamente pelo próximo resultado. Será GPT-5? DALL-E 4? Uma novidade versão do Codex? Acontece que a resposta era alguma coisa que quase ninguém esperava.

Na semana passada, OpenAI revelou Sora, e fez toda a internet falar. O que é esse novo resultado? Quão bom é isso? Porquê isso afetará o porvir?

Neste cláusula, vamos falar sobre todas essas questões junto com uma extra: em uma confrontação imediata com Midjourney. Embora Sora tenha porquê objetivo gerar vídeos, é bastante interessante dar uma olhada em porquê ele se compara ao Midjourney quando recebe a mesma solicitação.

O que é Sora?

Não somos estranhos ao Midjourney, portanto vamos nos concentrar em Sora: O mais recente protótipo de espalhamento da OpenAI voltado para a geração de texto para vídeo. Em fevereiro de 2024, ainda não estava disponível publicamente, mas já estamos vendo porquê é incrível por meio do showcase da OpenAI em seu site e dos vídeos gerados por eles no Twitter.

Screenshot 2024 02 19 195512Screenshot 2024 02 19 195512

Semelhante ao DALL-E 3, ele usa o poder da arquitetura do transformador para entender melhor os prompts e modificá-los em alguma coisa que possa entender. Quanto à sua originalidade, é capaz de gerar vídeos fotorrealistas e animados com uma estranheza quase assustadora em relação aos vídeos reais.

Serei honesto: não fiquei tão entusiasmado com um protótipo de IA desde os primeiros dias do DALL-E.

Sora vs. Midjourney: confrontação direta com prompt

Midjourney não pode gerar vídeos, mas isso não significa que não possamos confrontar sua produção com Sora. Temos elogiado consistentemente Midjourney em nossos artigos anteriores, portanto é lógico que ele é tão bom, se não melhor, que Sora em seu estágio inicial, visível? Vamos deslindar.

O Varão nas Nuvens

Incitar: Um jovem de 20 anos está sentado em uma nuvem no firmamento, lendo um livro.

11

Os olhos dela

Incitar: Extremo close-up do olho de uma mulher de 24 anos piscando, em Marrakech durante a hora mágica, filme cinematográfico filmado em 70mm, profundidade de campo, cores vivas, cinematográfico.

22

Grande Sul

Incitar: Vista de drone das ondas quebrando contra os penhascos escarpados ao longo da praia garay point de Big Sur. As águas azuis agitadas criam ondas com pontas brancas, enquanto a luz dourada do sol poente ilumina a costa rochosa. Uma pequena ilhéu com um farol fica ao longe, e arbustos verdes cobrem a extremidade do penhasco. A queda acentuada da estrada até à praia é um feito dramático, com as bordas da falésia a projetarem-se sobre o mar. Esta é uma vista que tomada a formosura crua da costa e a paisagem acidentada da Pacific Coast Highway.

33

A corrida do ouro

Incitar: Imagens históricas da Califórnia durante a corrida do ouro.

44

Aviões de papel

Incitar: Um grupo de aviões de papel voa por uma selva densa, contornando as árvores porquê se fossem pássaros migratórios.

55

O robô

Incitar: A história da vida de um robô em um cenário cyberpunk.

66

O lobo

Incitar: Uma bela animação de silhueta mostra um lobo uivando para a lua, sentindo-se solitário, até encontrar sua matilha.

77

O Monstro Fofo

Incitar: A cena animada apresenta um close-up de um monstro pequeno e fofo ajoelhado ao lado de uma vela vermelha derretida. O estilo artístico é 3D e realista, com foco na iluminação e textura. O clima da pintura é de assombro e curiosidade, enquanto o monstro olha para a labareda com olhos arregalados e boca oportunidade. A sua pose e frase transmitem uma sensação de inocência e diversão, porquê se estivesse a explorar o mundo à sua volta pela primeira vez. O uso de cores quentes e iluminação dramática realça ainda mais a atmosfera aconchegante da imagem.

88

A lontra

Incitar: Uma adorável lontra feliz está esperançoso em uma prancha de surf usando um colete salva-vidas amarelo, cavalgando ao longo de águas tropicais turquesa perto de ilhas tropicais exuberantes, estilo de arte de renderização do dedo 3D.

99

O resultado final

Para ser honesto, isso parece um pouco porquê confrontar maçãs e laranjas. Dito isto, é realmente surpreendente para mim porquê alguns deles são tão próximos uns dos outros, tanto na semblante quanto na qualidade universal. Se é isso que podemos esperar de Sora, portanto o hype é definitivamente justificado.

Realmente parece que a conversão de texto em imagem foi um pico que já conquistamos. Não me interpretem mal, continuará a melhorar, mas agora todos os olhos estão definitivamente voltados para a geração de texto para vídeo. Junto com Runway e Pika Labs, Sora está abrindo caminho para um novo duelo no espaço de IA. E o que é mais louco é que o que estamos vendo é unicamente uma prévia do que está por vir.

Quem sabe o que acontecerá nos próximos anos? Os deepfakes voltarão para pior? Ou talvez um filme totalmente gerado por IA concorrendo ao Oscar no horizonte?

Seja o que for, só espero que estejamos muito preparados para as suas consequências porquê sociedade. O que você acha de Sora? Deixe-nos saber nos comentários aquém.

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button