Firefly, o centro da Adobe para tudo relacionado à IA, está no centro de nossas inovações mais recentes. A empresa anunciou uma série de atualizações baseadas em IA em sua conferência Max Creative na terça-feira. Enquanto o resto de nós está enlouquecendo (e preocupar) via OpenAI Novo aplicativo Sora AIA Adobe está caminhando em uma direção diferente. Seu recurso mais recente é a geração de áudio AI.
Adobe se tornou a segunda maior empresa de tecnologia. Implante áudio gerado por IA Seguindo o Veo 3 do Google, ele foi apresentado aos modelos de vídeo de IA. As ferramentas de áudio de IA anteriores focavam principalmente em efeitos sonoros. Com esta ferramenta, você pode gravar seu rugido como um monstro, e a IA irá aprimorá-lo enquanto mantém o ritmo da gravação. Hoje, a Adobe está desenvolvendo suas ferramentas de áudio e introduzindo novas ferramentas.
A geração de trilha sonora e a geração de áudio são exatamente o que dizem. Você pode criar música de fundo e gravar roteiros para seus vídeos. No entanto, cada um traz benefícios pioneiros no setor que atraem os criadores. Atualmente disponível em versão beta.
A Adobe também lançou o Firefly Image Model de 5ª geração mais recente. Geração aprimorada de imagens fotorrealistas e capacidade de usar edição baseada em prompt. Há também um novo editor de vídeo Firefly, uma linha do tempo multitrack para ajudá-lo a gerenciar seus clipes gerados por IA. A Adobe está expandindo sua parceria com duas novas empresas de IA: ElevenLabs e Topaz Labs. A Adobe também permite que você crie seus próprios modelos de IA personalizados. Para mais notícias sobre IA, Assistente de IA chega ao Photoshop e Express.
Geração de áudio
Gerar áudio com Firefly é fácil e inclui muitos recursos úteis para quase todos os projetos. Esta é uma janela simples onde você pode inserir as palavras que deseja que a voz da IA leia. Você também pode enviar um roteiro de até 7.500 caracteres (aproximadamente 15 a 20 minutos de vídeo). Após o upload, você pode escolher entre 50 vozes marcadas com idade e sexo aproximados, incluindo opções não binárias. Pode gerar áudio em 20 idiomas diferentes. Mas o interessante é que você pode ajustar as instruções.
A fala é mais do que apenas ler palavras em uma página. Quando lemos passagens longas ou conversamos com outras pessoas, naturalmente adicionamos ênfase, emoção e ritmo ao nosso discurso. O novo programa também permite adicionar pausas onde você deseja que a IA faça uma pausa e destacar seções onde você precisa alterar o tom.
Se você é como eu e ninguém consegue pronunciar seu nome corretamente na primeira tentativa, você pode usar a ferramenta Corrigir Pronúncia para ter certeza de não cometer erros. Selecione um nome ou nome próprio, adicione um detalhamento de pronúncia e a IA o usará para suavizar a pronúncia.
Essas ferramentas têm como objetivo oferecer mais controle que outros programas de conversão de texto em fala não oferecem necessariamente, além da capacidade prática de ajustar seções específicas.
“Esta é uma forma de dar vida ao discurso de criadores, proprietários de pequenas empresas, educadores, qualquer pessoa que realmente tenha uma história para contar. Eles provavelmente não se sentem tão confortáveis quanto nós em apenas pegar um microfone e falar”, disse Jay LeBoeuf, chefe de áudio de IA da Adobe, em uma entrevista.
O áudio Firefly é um modelo de IA completamente novo. Mas não é a única opção. A Adobe tem aumentado constantemente sua lista de modelos de IA de terceiros este ano para vídeos e imagens de IA. Estamos mais uma vez expandindo essas opções incluindo o modelo multilíngue V2 da ElevenLab como uma opção para geração de fala.
Aqui está um exemplo em que você é solicitado a escrever uma descrição para música de IA.
Gere músicas e trilhas sonoras
O licenciamento de música é complicado, especialmente para uso comercial. Então vamos começar com a parte mais importante. A música gerada nas trilhas sonoras geradas pelo Firefly está sujeita a uma licença universal. Isso significa que você pode usá-lo para qualquer finalidade e indefinidamente. A Adobe cria ferramentas de IA usando conteúdo (neste caso, áudio) que temos permissão para usar para treinamento de IA. Portanto, em teoria, não há necessidade de o áudio do Firefly AI ser removido do YouTube ou de outras plataformas ou sujeito a violações horríveis de direitos autorais.
“Este é um momento único no mundo em que o licenciamento de música está na mente de todos e os criadores estão frustrados ou confusos ao tentar fazer o que é melhor para o seu conteúdo”, disse LeBoeuf. “Portanto, só queremos esclarecer a confusão.”
Na demo, Firefly rejeitou uma solicitação que incluía o nome do artista, dizendo que violava as diretrizes do usuário devido a questões de direitos autorais. Por exemplo, as modelos não são treinadas na música de Taylor Swift, então não podem criar músicas como ela.
Agora a parte divertida. Generate Soundtrack é a primeira ferramenta musical de IA da Adobe projetada para eliminar as suposições ao descobrir o que você deseja. Envie seu vídeo e nossa IA irá analisá-lo. Com base nessa avaliação, a Firefly cria prompts que considera apropriados para o seu vídeo. Este é um prompt no estilo Mad Libs e você pode trocar os descritores conforme necessário. O prompt consiste em três partes. Descreva a sensação geral, o estilo (gênero de pensamento) e o propósito (comercial, experimental, etc.). Você também pode ajustar o ritmo e o nível de energia.
Quando estiver satisfeito com as instruções, clique em Gerar e você terá quatro variações musicais tocando em dois minutos. O áudio terá a mesma duração do vídeo, mas você pode editá-lo conforme necessário. Você pode enviar vídeos de até 5 minutos de duração.
Para mais informações, por favor verifique Como funciona o aplicativo de câmera Project Indigo da Adobe, agora compatível com iPhone 17.

















