Tech

Stability AI apresenta novo gerador de imagem Stable Cascade AI

IA de segurança lançou hoje seu mais recente gerador de imagens de IA de código ingénuo na forma de Cascata fixo. O novo pai de arte de IA representa um salto significativo na capacidade de fabricar imagens e textos realistas, superando modelos anteriores, uma vez que Stable Diffusion e seu equivalente maior, Stable Diffusion XL. O que diferencia o Stable Cascade não é exclusivamente seu desempenho, mas também sua eficiência, que é crucial no mundo vertiginoso da IA.

Arquitetura de salsicha

O sigilo por trás Cascata fixo capacidades impressionantes residem na sua arquitetura Würstchen. Esta escolha de design reduz efetivamente o tamanho do espaço latente, que é um termo técnico para a representação abstrata de dados dentro do padrão. Ao fazer isso, o Stable Cascade pode operar mais rapidamente, reduzindo o tempo necessário para gerar imagens, e também reduzir os custos associados ao treinamento da IA. Apesar dessas eficiências, a qualidade das imagens produzidas permanece subida. Na verdade, o padrão possui um fator de compressão de 42, um salto significativo em relação ao fator de 8 visto na Divulgação Fixo, o que é uma prova de sua velocidade e eficiência aprimoradas.

Estágio A, Estágio B e Estágio C

O Stable Cascade consiste em três modelos: Stage A, Stage B e Stage C, representando uma cascata para geração de imagens, daí o nome “Stable Cascade”. Os estágios A e B são usados ​​para compactar imagens, de forma semelhante ao trabalho do VAE na disseminação fixo. No entanto, uma vez que mencionado anteriormente, com esta feição pode ser alcançada uma compressão de imagens muito maior. Outrossim, o Estágio C é responsável por gerar as pequenas latentes 24 x 24 a partir de um prompt de texto. A imagem a seguir mostra isso visualmente. Observe que o Estágio A é um VAE e ambos os Estágios B e C são modelos de disseminação.

Gerador de imagem AI de código ingénuo Cascade fixo

Um dos aspectos mais emocionantes Cascata Fixo é sua natureza de código ingénuo. O código deste gerador de imagens de IA está disponível gratuitamente no GitHub, juntamente com scripts úteis para treinar e usar o padrão. Esta franqueza convida uma comunidade de desenvolvedores e aficionados de IA a contribuir para o desenvolvimento do padrão, potencialmente levando a ainda mais avanços. No entanto, é importante observar que aqueles que desejam usar o Stable Cascade para fins comerciais precisarão atender aos requisitos de licenciamento.

Cá estão alguns outros artigos que você pode descobrir interessantes sobre o ponto Stability AI:

Para esta versão, a Stability AI está oferecendo dois pontos de verificação para o Estágio C, dois para o Estágio B e um para o Estágio A. O Estágio C vem com uma versão de 1 bilhão e 3,6 bilhões de parâmetros, mas o desenvolvimento e a equipe recomendam fortemente o uso da versão de 3,6 bilhões, já que a maior secção do trabalho foi investida em seu ajuste fino.

As duas versões para o Estágio B somam 700 milhões e 1,5 bilhão de parâmetros. Ambos alcançam ótimos resultados, porém o 1,5 bilhão é magnífico na reconstrução de pequenos e finos detalhes. Portanto, você obterá os melhores resultados se usar a versão maior de cada um. Por último, o Estágio A contém 20 milhões de parâmetros e é fixo devido ao seu pequeno tamanho.

O Stable Cascade não se limita exclusivamente à sua tecnologia mediano; ele oferece um conjunto de extensões que podem ser usadas para ajustar seu desempenho. Estes incluem uma rede de controle, um adaptador IP e um LCM, entre outros. Essas ferramentas dão aos usuários a capacidade de apropriar o padrão às suas necessidades específicas, seja ajustando o estilo das imagens geradas ou integrando o padrão com outro software.

Quando comparado a outros modelos de IA do mercado, uma vez que DallE 3 e Mid Journey, o Stable Cascade se destaca. Sua combinação única de recursos e capacidades o posiciona uma vez que um potente concorrente no Geração de imagens de IA campo. Não se trata exclusivamente da tecnologia em si, mas também de quão atingível ela é. A Stability AI disponibilizou o Stable Cascade através de várias plataformas, incluindo a Livraria HuggingFace e o aplicativo Pinokio, o que significa que uma ampla gama de usuários, de amadores a profissionais, pode explorar e aproveitar os recursos avançados deste padrão.

Disponibilidade Mercantil

Olhando para o porvir, a Stability AI tem planos de oferecer uma licença de uso mercantil para o Stable Cascade. Esta mudança abrirá novas oportunidades para empresas e profissionais criativos utilizarem os recursos do padrão em seus projetos. Mas antes que isso aconteça, a empresa está comprometida com um período completo de testes e refinamento para prometer que a utensílio atenda aos altos padrões exigidos para aplicações comerciais.

O papel da comunidade no desenvolvimento da Cascata Fixo não pode ser exagerado. Os utilizadores não são exclusivamente receptores passivos desta tecnologia; eles estão ativamente engajados na geração de teor personalizado e na exploração das possibilidades do padrão. Oriente envolvente colaborativo é vital para a inovação, pois permite a partilha de ideias e técnicas que podem ultrapassar os limites do que a IA pode perceber. Stability AI explica um pouco mais sobre as conquistas do Stable Cascade:

“Outrossim, o Stable Cascade alcança resultados impressionantes, tanto visualmente quanto em termos de avaliação. De harmonia com nossa avaliação, o Stable Cascade apresenta melhor desempenho tanto no alinhamento súbito quanto na qualidade estética em quase todas as comparações. A imagem supra mostra os resultados de uma avaliação humana usando uma mistura de parti-prompts (link) e prompts estéticos. Especificamente, Stable Cascade (30 etapas de inferência) foi comparado com Playground v2 (50 etapas de inferência), SDXL (50 etapas de inferência), SDXL Turbo (1 lanço de inferência) e Würstchen v2 (30 etapas de inferência).

O Stable Cascade do Stability AI é uma soma notável ao Cenário de geração de imagens de IA. Com sua arquitetura eficiente, acessibilidade de código ingénuo e amplas opções de personalização, oferece uma utensílio poderosa para quem deseja fabricar imagens e textos realistas. À medida que a comunidade continua a crescer e a contribuir para a evolução do padrão, os usos potenciais do Stable Cascade parecem ilimitados. O excitação em torno deste novo gerador de imagens de IA é uma indicação clara de que o campo da perceptibilidade sintético não está exclusivamente a crescer – está a prosperar, com inovações que continuam a surpreender e inspirar.

Últimas ofertas de gadgets geeks

Divulgação: Alguns de nossos artigos incluem links afiliados. Se você comprar alguma coisa por meio de um desses links, o lifetechweb Gadgets poderá lucrar uma percentagem de afiliado. Conheça nossa Política de Divulgação.

Artigos relacionados

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button