Tech

Ernest Piatrovich, gerente de produto da ARTA – Série de entrevistas

Você foi responsável por gerenciar o gerador ARTA – AI Artwork desde a fase de idealização até agora. Você poderia compartilhar alguns insights sobre esses primeiros dias?

Claro! Aqueles foram tempos dinâmicos. Conseguimos lançar um aplicativo bem feito em apenas uma semana, tornando-nos um dos primeiros criadores de aplicativos de consumo a oferecer funcionalidade de geração de texto para imagem em dispositivos móveis. Nosso objetivo period construir um produto para o mercado de massa que proporcionasse às pessoas “um artista” no bolso. Assim, desde os estágios de conceituação e desenvolvimento inicial, focamos na usabilidade e escalabilidade. Mas, apesar de entrarmos no mercado muito oportunamente, foi bastante desafiador aumentar nossos volumes de instalações de forma adequada, mesmo com uma equipe brilhante de compra de mídia como a nossa. Um aumento significativo ocorreu três meses após o lançamento do aplicativo, quando nosso recurso Avatar foi divulgado. O quantity rapidamente se tornou moderadamente alto para o nosso nicho e, desde então, nossa tarefa tem sido mantê-lo e aumentá-lo.

Qual foi a pilha de tecnologia unique que você lançou e quais foram alguns dos desafios da geração de arte durante esse período?

Lançamos com base no Steady Diffusion 1.3 usando a API oficial do Stability.ai. Devo dizer que a situação com a qualidade das gerações de então e de agora é como a noite e o dia. Quando começamos, nossos gerentes de controle de qualidade relatavam frequentemente problemas relacionados ao valor estético das imagens ou imprecisões na representação de conceitos e recursos específicos. No entanto, isso period padrão para Difusão Estável naquela época. Agora, o resultado da geração é muito melhor em todos os aspectos, incluindo reprodução estilística, coerência da composição, fidelidade visible, nível de detalhe e muito mais.

Emblem após o lançamento do aplicativo, começamos a alugar servidores na Amazon, e apoiá-los acabou sendo um grande desafio. Mesmo com fundos suficientes, pode não haver A100 grátis disponível quando você precisar e você terá que esperar alguns dias. Assim, tivemos que viver sem escalonamento automático, redirecionando todo o tráfego excedente para as APIs dos nossos parceiros.

Manter tudo isso continua bastante complicado até hoje, com pequenos problemas ocorrendo de um lado ou de outro a cada mês ou mais. Por exemplo, ocasionalmente encontramos problemas temporários com a qualidade das gerações quando o provedor atualiza o servidor, testa pesos ou implementa outras alterações que afetam a saída da geração. Esses erros podem durar de uma hora a meio dia e são imprevisíveis e difíceis de rastrear. Normalmente, quando nosso departamento de suporte recebe um relatório do usuário sobre imagens borradas ou algum outro problema ocorrido, o provedor da API já corrigiu o problema. No entanto, é uma preocupação séria para nossos usuários. Portanto, estamos agora construindo um sistema que combina vários provedores e nossos próprios servidores para gerações especiais, permitindo-nos ter mais controle do nosso lado.

Como gestor de produto, que decisões estratégicas foram fundamentais para guiar a ARTA à sua posição de topo emblem após o seu lançamento?

A ascensão precoce da ARTA (na época chamada de Aiby) resultou da decisão oportuna de implementar o recurso viral Avatar quando ele começou a round nas redes sociais. Rapidamente reconhecemos o interesse crescente nesta funcionalidade. Toda a nossa equipe, incluindo produto, advertising and marketing e desenvolvimento, estava na mesma sintonia e period visionária sobre seu sucesso. Também reconhecemos que um curto período de tempo para chegar ao mercado period essential. Assim, desde o primeiro dia, dedicamos todos os nossos recursos para concretizar esta funcionalidade, priorizando-a acima de outras tarefas.

Como nosso prazo period o mais rápido possível para não perder o momento em que os AI Avatars atingissem seu pico de hype, optamos por usar uma solução de terceiros e personalizá-la para nosso aplicativo. Enquanto os avatares começavam a ganhar força no cellular, a tecnologia já estava disponível na internet há algum tempo, inclusive com API. Graças aos esforços concentrados da equipe, nossa primeira versão funcional chegou à App Retailer em apenas cinco dias, oferecendo resultados de avatar altamente competitivos. Isso nos ajudou a alcançar a segunda posição nas paradas americanas e a permanecer o segundo aplicativo mais baixado nos EUA por uma semana.

Sua equipe lançou recentemente uma atualização para o recurso de geração de avatar de IA do ARTA. Você poderia compartilhar alguns detalhes sobre isso?

Os modelos de IA tendem a adicionar características faciais genéricas durante o treinamento, fazendo com que os avatares pareçam diferentes das fotos de origem, e quanto mais exclusivas forem as características de alguém, mais diferente da interpretação da IA ​​pode parecer. Para resolver esse problema, decidimos criar nosso próprio serviço de avatar. Já usamos uma API de terceiros há muito tempo, mas não obtivemos melhorias significativas. Com a mudança do servidor, conseguimos configurar uma tecnologia de treinamento mais otimizada para manter melhor a semelhança do rosto actual do usuário na saída do avatar. Embora eu não possa divulgar detalhadamente nosso pipeline exclusivo, isso se tornou possível devido a uma combinação específica de configurações SDXL, LORAs e intensificadores de rosto, e ainda não vimos melhores resultados em outros lugares.

Com o novo servidor, passamos de um custo fixo para cada pacote de avatar para uma taxa mensal de servidor e agora podemos oferecer avatares por meio de uma assinatura semanal, em vez de exigir compras separadas no aplicativo. Isso cria uma experiência mais gratificante e é muito mais barato para nossos usuários se eles quiserem gerar, por exemplo, cinco pacotes de avatares em uma semana ou alterar a entrada de fotos conforme avançam. Considerando tudo o que foi dito acima, a nossa oferta de avatar apresenta atualmente a melhor relação preço-desempenho do mercado. Embora existam aplicativos capazes de criar avatares realistas de alta qualidade, o ARTA se destaca por fornecer uma ampla gama de variações de saída brilhantes e coloridas, além de estilos realistas, todos com o mesmo nível preciso de reconhecimento facial.

De que outras maneiras a equipe melhorou os recursos do aplicativo?

Concluímos que o uso de APIs de terceiros é mais eficiente para casos de uso comuns, como geração de texto em imagem, conversão de imagem e pintura interna. Essa abordagem elimina a necessidade de perder tempo tentando descobrir como integrar essas funcionalidades à nossa infraestrutura de servidores. Além disso, reduz custos em situações em que um novo recurso não decola conforme o esperado e decidimos removê-lo. A indústria de geração de imagens de IA está evoluindo rapidamente, com inúmeros serviços dedicados disponíveis, por isso exploramos e adotamos gradualmente aqueles que se alinham aos nossos objetivos.

Ao mesmo tempo, as necessidades da ARTA revelam-se muitas vezes bastante singulares, exigindo conclusões internas. Nos casos em que APIs customizadas são inexistentes ou não oferecem qualidade de saída satisfatória, nos especializamos e customizamos nossos serviços internos e desenvolvemos nossas próprias soluções para alcançar os resultados que desejamos. Por exemplo, além de atualizar os avatares de IA, nossos engenheiros de ML e immediate criaram um novo pipeline para o recurso Filtros de IA (Selfies) do aplicativo. Também desenvolvemos um algoritmo exclusivo para nosso próximo recurso AI Child – uma funcionalidade de geração que permite que duas pessoas mesclem suas fotos e vejam como seu filho ficaria. Com base na minha percepção do mundo como gerente de produto, inicialmente duvidei de seu sucesso, mas os criativos publicitários com esse conceito são muito populares. Portanto, verificar os insights de advertising and marketing é especialmente útil em casos relacionados a conteúdo.

Os usuários podem influenciar o processo artístico no ARTA? Em caso afirmativo, quais ferramentas e opções estão disponíveis para os usuários personalizarem a arte gerada pela IA?

Lidamos com todos os aspectos complexos relacionados à geração, visando proporcionar aos nossos usuários uma experiência artística simples e sem sobrecarga técnica desnecessária. Portanto, a principal forma pela qual os usuários influenciam o resultado é por meio de prompts. Mantemos esse processo transparente, mostrando a solicitação exata da palavra que será enviada ao modelo para geração e apenas oferecemos assistência na composição de prompts eficazes, se necessário.

Selecionamos as melhores configurações padrão para cada modelo integrado para que os usuários não se preocupem com isso. Normalmente, não há necessidade de ajustá-los para maximizar os resultados, pois eles já produzem uma geração perfect. Ainda assim, se o usuário quiser experimentar, um modo avançado está a um toque de distância, e alguns parâmetros mais profundos estão na seção de configurações.

Em breve, adicionaremos um parâmetro Seed, permitindo que os usuários tenham controle complete sobre a geração quando precisarem recriar uma imagem idêntica do zero. Além disso, planejamos expandir a lista de proporções. Também estamos pensando em adicionar diversas redes de controle às gerações regulares. Eles já são suportados no lado do servidor, pois os usamos para gerar filtros e esboços de IA, mas ainda não foram entregues aos usuários finais.

Como você percebe o impacto da IA ​​como o ARTA no mercado de arte tradicional? Você vê a geração de arte por IA como uma ruptura ou um aprimoramento da indústria da arte?

Eu vejo isso como um aprimoramento. A IA generativa introduziu oportunidades novas e valiosas para aprimorar o processo artístico e, ao mesmo tempo, reduzir significativamente o tempo de resposta. Ele auxilia artistas digitais, designers, ilustradores e outros criadores de conteúdo visible em uma variedade de tarefas, desde a exploração de ideias e desenvolvimento de conceitos até a geração de esboços e imagens prontas para uso. Em última análise, a nossa capacidade de alavancar os seus avanços é limitada apenas pela nossa imaginação.

Por exemplo, tenho como interest criar jogos para PC e, recentemente, usei o ARTA para gerar um conjunto de ícones para habilidades e itens. Eu poderia projetá-los sozinho usando o Adobe Illustrator, mas com um gerador de imagens consegui o que precisava quase imediatamente. Minha esposa, por sua vez, é fotógrafa retocadora. Graças ao Preenchimento Generativo do Photoshop, ela trabalha muito mais rápido e tem mais tempo livre (ou mais renda se decidir aceitar mais pedidos de retoques).

Quando bem feitas, as imagens geradas por IA podem parecer indistinguíveis de obras de arte profissionais. Porém, na minha opinião, a IA nunca substituirá um verdadeiro profissional. Não importa o quão habilidosas as redes neurais se tornem, elas ainda são treinadas com base em dados criados por humanos, o que significa que tudo o que geram já existe em algum lugar. Tal como antes e agora, ideias verdadeiramente inovadoras só podem ser produzidas por pessoas. Embora o significado tradicional da arte permaneça associado a peças feitas pelo homem, a arte da IA ​​é como um desdobramento antecipado, convidando todos, independentemente da formação artística, a experimentar uma experiência nova e emocionante.

Olhando além de apenas melhorar a qualidade da imagem, onde você vê o futuro da geração de imagens de IA?

Junto com a qualidade da imagem, a velocidade das gerações aumentará, levando automaticamente a resultados mais econômicos.

Acho que não demorará muito para que haja uma maneira fácil de gerar os mesmos personagens em diferentes ambientes e posições, para que possamos ver a ascensão da IA ​​em quadrinhos, livros infantis, gráficos de jogos e muito mais. O design de interiores e a produção de criativos publicitários já são as esferas que aproveitam ativamente a IA generativa, mas há mais pela frente à medida que a tecnologia continua a evoluir.

Considerando que todas as gerações requerem GPUs fortes, estas tecnologias irão desenvolver-se juntamente com a IA durante algum tempo. Estamos apenas no início da jornada. Talvez a nova Apple do nosso tempo seja a Nvidia, com todos, ou pelo menos aqueles da indústria de TI, antecipando o lançamento de novas placas de vídeo, assim como todos fizemos com os iPhones.

Os geradores de imagens de IA continuarão a proporcionar experiências divertidas e envolventes, seja introduzindo novos conceitos emergentes da cultura pop ou revivendo ideias antigas aprimoradas com tecnologia melhor. Por exemplo, o interesse nas gerações AI Child está crescendo atualmente. Uma tecnologia recente baseada na Difusão Estável demonstrou resultados impressionantes ao fundir as características de dois indivíduos para revelar a aparência potencial de seu filho biológico. Os resultados superam em muito o que estava disponível em websites de horóscopos há alguns anos, e as pessoas estão ansiosas para tentar novamente.

Quais são suas previsões sobre o que devemos esperar da IA ​​generativa?

A onda de popularidade da geração de vídeos está no horizonte. Com os avanços na tecnologia atingindo um nível suficiente, sem dúvida haverá tentativas de treinar redes neurais usando expressões faciais e gestos de pessoas para criar avatares de vídeo, potencialmente até mesmo com vozes exclusivas de usuários.

AI Audio é outro avanço significativo que inaugura uma nova period para a indústria de produção musical. Essa tecnologia já apresentou oportunidades incríveis para compor músicas com base apenas na entrada de texto, tornando-se uma excelente ferramenta para criar trilhas sonoras personalizadas para vários tipos de conteúdo de vídeo. No geral, é muito divertido ouvir algo tão mundano como os Termos de Uso cantados ou cantados com entonação romântica.

Obrigado pela ótima entrevista, leitores que desejam saber mais ou gerar algumas imagens devem visitar o ARTA.

Artigos relacionados

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button