A última patente da Microsoft revela um Copilot capaz de compor músicas que combinam com vídeos e apresentações em PowerPoint

Os leitores ajudam a oferecer suporte ao Home windows Report. Podemos receber uma comissão se você comprar através de nossos hyperlinks.


Leia nossa página de divulgação para descobrir como você pode ajudar o Home windows Report a sustentar a equipe editorial Leia mais

Embora a gigante da tecnologia com sede em Redmond tenha começado a atualizar o Copilot com uma interface totalmente nova que faz o modelo de IA se destacar com uma aparência elegante, parece que a empresa tem planos ainda maiores para isso.

Em uma patente publicada recentemente, a Microsoft está desenvolvendo um modelo de inteligência synthetic para composição de partituras de áudio que pode criar músicas ou áudios que correspondam a vídeos, textos, apresentações em PowerPoint, realidades virtuais ou até mesmo videogames em desenvolvimento.

O artigo, intitulado sugestivamente, “Modelo de inteligência synthetic para composição de partituras de áudio”, discute os métodos que este Copiloto usaria para criar música.

Primeiro, ele parte para a coleta de dados, reunindo uma grande quantidade de dados de treinamento, que inclui muitos conjuntos de dados audiovisuais contendo componentes de vídeo e áudio.copiloto compõe música

Cada um desses conjuntos de dados é analisado para extrair diferentes tipos de recursos. Por exemplo, analisaria os recursos e elementos visuais do vídeo, como cores, formas, movimentos e cenas. Qualquer texto que apareça no vídeo, como legendas ou texto na tela, também será extraído. Por último, os recursos de áudio do vídeo, como sons e música, já estão presentes no vídeo e não fazem parte de uma partitura musical.

Depois de extraí-los, o Copilot os analisaria e encontraria uma correlação entre esses recursos. Por exemplo, certas cenas (como um pôr do sol) costumam ter tipos específicos de música (como músicas calmas e relaxantes).

O Copilot seria treinado com esses recursos e, usando o sistema de correlação, geraria pontuações de áudio apropriadas que correspondessem aos recursos visuais e textuais dos novos vídeos.

Na vida actual, essa tecnologia pode ser utilizada em diversas aplicações, como:

  • Produção de Cinema e Vídeo: Gerando automaticamente pontuações de fundo para filmes, programas de TV ou vídeos on-line.
  • Anúncio: Criar música que se adapta perfeitamente ao clima e à mensagem dos comerciais.
  • Jogos: Produzindo trilhas sonoras dinâmicas que mudam com base no visible e nas ações do jogo.
  • Realidade Digital: Aprimorando experiências imersivas com áudio que se adapta ao ambiente visible.

Com a capacidade de compor música, o Copilot também pode economizar tempo e garantir que o áudio complemente perfeitamente o conteúdo visible, automatizando o processo de composição de partituras de áudio.

Vale ressaltar que o modelo de IA pode de alguma forma criar música em um estado muito rudimentar usando o plugin SUNO, lançado no início deste ano.

No entanto, uma melhoria desse plugin seria mais que bem-vinda. Isso permitiria aos criadores definir o conceito musical de seu produto antes de apresentá-lo a um compositor musical actual.

Embora a questão de realmente substituir um compositor musical deva ser considerada, em última análise, dar ao Copilot a capacidade de compor música apenas aumentaria a produtividade no futuro. Mas o que você pensa sobre isso?

Você pode ler o artigo aqui.


Flavius ​​é escritor e produtor de conteúdo de mídia com interesse specific em tecnologia, jogos, mídia, cinema e narrativa. Ele está sempre curioso e pronto para enfrentar tudo o que há de novo no mundo da tecnologia, cobrindo diariamente os produtos da Microsoft. A paixão por jogos e {hardware} alimenta sua abordagem jornalística, fazendo dele um grande pesquisador e redator de notícias que está sempre pronto para trazer a você o que há de mais moderno!


Exit mobile version