AI Labs estão competindo para construir data centers É mais ou menos do tamanho de Manhattan, Cada uma custa bilhões de dólares e consome tanta energia quanto uma cidade pequena. Este esforço é impulsionado por uma profunda crença na expansão. A ideia é que, ao adicionar mais poder computacional aos métodos de treinamento de IA existentes, criaremos eventualmente sistemas superinteligentes que possam realizar todos os tipos de tarefas.
Mas os investigadores da IA afirmam cada vez mais que a escalabilidade de grandes modelos linguísticos pode estar a atingir os seus limites e que podem ser necessários outros avanços para melhorar o desempenho da IA.
Essa é a aposta que Sara Hooker, ex-vice-presidente de pesquisa de IA da Cohere e ex-aluna do Google Brain, está fazendo com sua nova startup. laboratório de adaptação. Ela foi cofundadora da empresa com Cohere e o veterano do Google, Sudip Roy. A empresa baseia-se na ideia de que dimensionar o LLM se tornou uma forma ineficiente de extrair mais desempenho dos modelos de IA. Hooker, que deixou Kohia em agosto, anunciou calmamente A empresa planeja iniciar uma campanha de contratação mais ampla este mês.
Em entrevista ao TechCrunch, Hooker disse que o Adaption Labs está construindo um sistema de IA que pode se adaptar e aprender continuamente com a experiência do mundo real, e fazê-lo de forma extremamente eficiente. Ela se recusou a compartilhar detalhes sobre a metodologia por trás dessa abordagem ou se a empresa depende do LLM ou de outra arquitetura.
“Estamos num ponto de inflexão agora, onde está claro que a maneira como apenas dimensionamos esses modelos, a abordagem atraente, mas muito chata, da pílula de expansão, não está produzindo inteligência que possa navegar e interagir com o mundo”, disse Hooker.
De acordo com Hooker, a adaptação está “no cerne da aprendizagem”. Por exemplo, se você der uma topada ao passar pela mesa da sala de jantar, aprenderá a andar ao redor da mesa com mais cuidado na próxima vez. O AI Lab procurou capturar essa ideia por meio do aprendizado por reforço (RL), que permite que os modelos de IA aprendam com os erros em um ambiente controlado. No entanto, as técnicas de RL atuais não ajudam os modelos de IA de produção (ou seja, sistemas já utilizados pelos clientes) a aprender com os erros em tempo real. Eles apenas continuam batendo os dedos dos pés.
Alguns laboratórios de IA oferecem serviços de consultoria que permitem às empresas ajustar modelos de IA para atender às suas necessidades personalizadas, mas isso tem um preço. A OpenAI supostamente exige que os clientes: gastar mais de US$ 10 milhões Fazemos parceria com a empresa para fornecer serviços de consultoria de ajuste fino.
evento de crise tecnológica
São Francisco
|
27 a 29 de outubro de 2025
“Temos alguns laboratórios de fronteira que determinam um conjunto de modelos de IA que estão disponíveis para todos da mesma forma, mas cuja adaptação é muito cara”, disse Hooker. “E, na verdade, não creio que isso precise mais ser verdade. Os sistemas de IA podem aprender de forma muito eficiente com seu ambiente. Provar isso mudará completamente a dinâmica de quem controla e molda a IA e, de fato, a quem esses modelos servem.”
Adaption Labs é o mais recente sinal de que a confiança da indústria na expansão de LLMs está vacilando. Um artigo recente de pesquisadores do MIT mostra que o maior modelo de IA do mundo Você pode ver rapidamente um declínio na receita. A atmosfera em São Francisco parece estar mudando. Dwarkesh Patel, um podcaster popular no mundo da IA, recentemente apresentou uma conversa incomumente cética com um conhecido pesquisador de IA.
O vencedor do Prêmio Turing, Richard Sutton, considerado o “pai da RL”, disse a Patel em setembro: LLM não é verdadeiramente escalável Porque eles não aprendem com experiências do mundo real. Este mês, Andrei Karpathy, um dos primeiros funcionários da OpenAI, disse a Patel: eu tinha uma reserva Sobre o potencial de longo prazo da RL para melhorar os modelos de IA.
Esse tipo de medo não é sem precedentes. No segundo semestre de 2024, Alguns pesquisadores de IA expressam preocupação Escalar um modelo de IA por meio de pré-treinamento (onde o modelo de IA aprende padrões de grandes conjuntos de dados) significa que há retornos decrescentes. Até então, o pré-treinamento era o molho secreto para a OpenAI e o Google melhorarem seus modelos.
As preocupações com o dimensionamento pré-treinamento desapareceram. aparecem nos dadosNo entanto, a indústria de IA encontrou outra forma de melhorar seus modelos. Em 2025, avanços revolucionários nos modelos de inferência de IA aumentarão ainda mais as capacidades dos modelos de IA, exigindo tempo e recursos computacionais adicionais para resolver problemas antes que possam ser respondidos.
O AI Lab parece acreditar que ampliar os modelos de inferência de RL e IA é a nova fronteira. Pesquisadores da OpenAI disseram anteriormente ao TechCrunch: Eles desenvolveram o primeiro modelo de inferência de IAo1, porque pensamos que aumentaria bem. Pesquisadores do Meta Institute e do Period Institute recentemente Publicou um artigo A pesquisa investiga como a RL pode dimensionar ainda mais o desempenho – supostamente Custou mais de US$ 4 milhões, Ele destaca como as abordagens atuais permanecem caras.
Em contraste, o Adaption Labs pretende encontrar o próximo avanço e provar que aprender com a experiência é muito mais barato. A empresa estava em negociações para levantar entre US$ 20 milhões e US$ 40 milhões em uma rodada inicial no início deste outono, de acordo com três investidores que visualizaram os materiais da proposta da empresa. A rodada já foi encerrada, mas o valor final é desconhecido. Hooker se recusou a comentar.
Questionado sobre investidores, Hooker disse: “Seremos muito ambiciosos”.
Hooker liderou anteriormente o Cohere Labs, onde treinou modelos de IA em pequena escala para casos de uso corporativo. Hoje, os sistemas compactos de IA superam regularmente os sistemas maiores de IA em benchmarks de codificação, matemática e raciocínio. Hooker espera continuar esta tendência.
Ela também construiu uma reputação por expandir o acesso à pesquisa em IA em todo o mundo, contratando talentos em pesquisa de regiões sub-representadas, como a África. A Adaption Labs planeja abrir um escritório em São Francisco em breve, mas Hooker disse que planeja contratar em todo o mundo.
Se Hooker e Adaptation Lab estiverem certos sobre os limites da escala, o impacto poderá ser significativo. Bilhões de dólares já foram investidos na expansão do LLM com a suposição de que modelos maiores levarão à inteligência geral. Mas a verdadeira aprendizagem adaptativa pode revelar-se não só mais poderosa, mas também muito mais eficiente.
Marina Temkin contribuiu com reportagens.