Desenvolvedores e empresas estão cada vez mais implantando agentes de IA e chatbots em seus aplicativos, mas até agora eles têm se limitado principalmente a texto. Empresa de geração de avatar digital fatia de limão está trabalhando para adicionar uma camada de vídeo aos chats com um novo modelo de difusão que pode criar avatares digitais a partir de uma única imagem.
O modelo, chamado Lemon Slice-2, cria um avatar digital que funciona em uma base de conhecimento e desempenha qualquer função que um agente de IA precisaria, incluindo responder perguntas de clientes, ajudar com questões de dever de casa e atuar como agente de apoio à saúde mental.
“Nos primeiros dias da GenAI, meus cofundadores começaram a experimentar diferentes modelos de vídeo, e ficou claro para nós que o vídeo seria interativo. O atrativo de ferramentas como o ChatGPT era que ele era interativo, e queremos que o vídeo tenha essa camada”, disse a cofundadora Lina Colucci.
De acordo com Lemon Slice, é um modelo de 20 bilhões de parâmetros que roda em uma única GPU e pode transmitir vídeo ao vivo a 20 quadros por segundo. A empresa disponibiliza esse modelo por meio de uma API e widgets incorporáveis que as empresas podem integrar em seus sites com uma única linha de código. Depois de criar seu avatar, você pode alterar o histórico, o estilo e a aparência do seu personagem a qualquer momento.
Além de avatares semelhantes a humanos, a empresa também está focada em ser capaz de gerar personagens não humanos para atender a diferentes necessidades. A startup utiliza a tecnologia da Eleven Labs para gerar as vozes desses avatares.
A Lemon Slice, fundada em 2024 por Lina Colucci, Sidney Primus e Andrew Weitz, aposta que se diferenciará de seus concorrentes ao usar um modelo de difusão de uso geral exclusivo (um tipo de modelo generativo que aprende a trabalhar retroativamente a partir de dados de treinamento ruidosos para gerar novos dados) para criar seus avatares.
“As soluções Avatar existentes que tenho visto agregam valor negativo ao produto”, diz Colucci. “Eles são assustadores, são rígidos. Eles parecem bons por alguns segundos, mas assim que você começa a interagir com eles, eles parecem muito assustadores e não fazem você se sentir seguro. O que está impedindo os Avatares de realmente decolarem é que não há Avatares suficientes.”
evento de crise tecnológica
São Francisco
|
13 a 15 de outubro de 2026
Para financiar seus esforços, a empresa anunciou na terça-feira que levantou US$ 10,5 milhões em financiamento inicial da Matrix Partners, Y Combinator, Dropbox CTO Arash Ferdowsi, Twitch CEO Emmett Shear e The Chainblooming.
A empresa afirma que possui proteções para evitar a duplicação não autorizada de rostos e vozes e usa modelos de linguagem abrangentes para moderação de conteúdo.
Lemon Slice se recusou a nomear as organizações que utilizam sua tecnologia, mas disse que seu modelo é usado em casos de uso como educação, aprendizagem de idiomas, comércio eletrônico e treinamento corporativo.
A startup enfrenta forte concorrência de startups de geração de vídeo e outros criadores de avatares digitais, como D-ID, HeyGen e Synthesia. GênioMáquina de Alma, práticae Avatar OS.
O parceiro da Matrix, Ilya Sukhar, acredita que os avatares serão úteis em áreas onde o vídeo é proeminente. Por exemplo, as pessoas preferem aprender no YouTube em vez de ler textos longos. Ele destacou que a força tecnológica e a exclusividade da Lemon Slice lhe darão uma vantagem sobre outras startups.
“Esta é uma equipe altamente técnica com histórico de envio de produtos de ML, bem como demonstrações e pesquisas. Muitos dos outros participantes são personalizados para cenários e setores específicos, e a Lemon Slice adota uma solução generalizada.” “Lição Amarga” É uma abordagem de escalonamento (de dados e computação) que também funcionou em outras modalidades de IA”, disse ele.
Jared Friedman, da Y Combinator, acredita que, em comparação com outras startups que se concentram em avatares semelhantes a humanos ou avatares semelhantes a personagens de jogos, a Lemon Slice pode gerar todos os tipos de avatares usando um modelo de estilo de difusão.
“Acho que a Lemon Slice é a única empresa com uma abordagem fundamental de ML que pode finalmente superar o vale misterioso e quebrar o teste de Avatar Turing. “Estamos treinando o mesmo tipo de modelo, um transformador de difusão de vídeo. É um modelo de uso geral que faz tudo de ponta a ponta, portanto não há limite máximo para a qualidade dos resultados. Também funciona em rostos humanos e não humanos, e você só precisa adicionar novos rostos.”
A startup conta atualmente com oito funcionários e planeja usar o financiamento para contratar pessoal de engenharia e de entrada no mercado, além de pagar taxas de computação para treinar seus modelos.


















