Da rua, o único sinal que encontrei de que era a sede da Inteligência Física em São Francisco foi o símbolo pi na porta, que era de uma cor ligeiramente diferente do resto do edifício. Uma vez lá dentro, você encontrará atividade imediatamente. Não há recepção, nem logotipo brilhando nas luzes fluorescentes.

Dentro, há uma enorme caixa de concreto, com longas mesas de madeira clara dispostas aleatoriamente, tornando-a um pouco menos solene. Alguns são claramente para o almoço, repletos de caixas de biscoitos de escoteiras, potes de Vegemite (aqui sou australiano) e pequenas cestas de arame recheadas com muitos condimentos. As tabelas restantes contam uma história completamente diferente. Muitos mais deles estão carregados com monitores, peças sobressalentes de robôs, um emaranhado de fios pretos e braços robóticos totalmente montados em vários estados enquanto tentam dominar o mundano.

Durante minha visita, um braço está dobrando, ou tentando dobrar, uma calça preta. Não funciona. O outro é alguém que está tentando virar a camisa do avesso com tanta determinação que sugere que terá sucesso não apenas hoje, mas no futuro. Terceiro, você deve descascar rapidamente a abobrinha e colocar as aparas em um recipiente separado. Pelo menos as aparas estão no caminho certo.

“Pense nisso como o ChatGPT, mas para robôs”, disse-me Sergey Levine, apontando para o balé motorizado que se desenrolava pela sala. Levine, professor associado da Universidade da Califórnia, Berkeley e um dos cofundadores da Physical Intelligence, tem o comportamento afável de alguém que passou um tempo considerável explicando conceitos complexos para pessoas que não os entendem imediatamente.

Ele explica que estou vendo a fase de teste de um loop contínuo. Os dados são coletados em estações robóticas aqui e em outros lugares, em armazéns, em casa e onde quer que as equipes possam se instalar, e os dados são usados ​​para treinar modelos baseados em robôs de uso geral. Depois que os pesquisadores treinam um novo modelo, eles retornam a essas estações para avaliação. A pasta de calças é uma experiência de alguém. O mesmo vale para virar sua camisa. Um descascador de abobrinha pode estar testando se o modelo pode ser generalizado para uma variedade de vegetais, aprendendo os movimentos básicos de descascar para poder manusear com sucesso maçãs e batatas que nunca encontrou antes.

Levine disse que a empresa opera cozinhas de teste neste prédio e em outros locais, incluindo residências, que usam hardware pronto para uso para expor os robôs a diferentes ambientes e desafios. Há uma máquina de café expresso sofisticada por perto, e você pensa que é para a equipe até que Levin esclarece: “Não, ela está lá para os robôs aprenderem”. O café com leite com espuma é só dados, e não uma vantagem para as dezenas de engenheiros no local que, em sua maioria, examinam computadores e assistem a experimentos mecanizados.

O hardware em si é intencionalmente modesto. As armas são vendidas por cerca de US$ 3.500, o que inclui o que Levine descreveu como uma “grande margem de lucro” do vendedor. Se fabricado internamente, os custos dos materiais cairiam para menos de US$ 1.000. Há alguns anos, diz ele, os roboticistas teriam ficado chocados com o que esses robôs poderiam fazer. Mas esse é o ponto. Boa inteligência compensa hardware ruim.

evento de crise tecnológica

Boston, Massachusetts
|
23 de junho de 2026

Enquanto Levine se desculpava, Laci Groom se aproximou de mim, movendo-se pelo espaço com a determinação de alguém que tinha seis coisas acontecendo ao mesmo tempo. Aos 31 anos, Groome ainda tem o frescor de um menino maravilha do Vale do Silício, conquistando o título logo ao abrir sua primeira empresa em sua terra natal, a Austrália, aos 13 anos e vendê-la nove meses depois (é assim que Vegemite a descreve).

Quando falei com ele pela primeira vez, enquanto recebia alguns visitantes vestidos de moletom no prédio, sua resposta imediata ao meu pedido para passar um tempo com ele foi: “Não, tenho uma reunião”. Agora ele tem cerca de 10 minutos.

Quando ele começou a acompanhar a pesquisa acadêmica do laboratório de Levine e Chelsea Finn, ele encontrou o que procurava. Chelsea Finn é ex-aluna de doutorado de Levine em Berkeley e agora dirige seu próprio laboratório em Stanford, focado no aprendizado robótico. Seus nomes continuaram aparecendo em todos os tipos de coisas interessantes que aconteciam na robótica. Quando ouviu rumores de que eles poderiam estar começando algo, ele localizou Karol Hausman, pesquisadora do Google DeepMind e professora da Universidade de Stanford que sabia que Groom estava envolvido. “Foi uma daquelas reuniões em que você sai e diz: ‘É isso’.”

Dado o seu histórico, alguns podem se perguntar por que ele não se tornou um investidor em tempo integral, mas Groom nunca teve a intenção de se tornar um investidor em tempo integral, ele me disse. Depois de deixar a Stripe, onde foi um dos primeiros funcionários, ele passou cerca de cinco anos como investidor anjo, fazendo apostas iniciais em empresas como Figma, Notion, Ramp e Lattice enquanto procurava a empresa certa para começar ou ingressar. Seu primeiro investimento em robô, Standard Bot, ocorreu em 2021 e o reintroduziu no campo que ele amava quando criança, construindo LEGO Mindstorms. Como ele brinca: “Passei muito mais tempo de férias como investidor”. Mas investir era apenas um meio de permanecer ativo e conhecer pessoas, e não o objetivo final. “Eu estava procurando uma empresa há cinco anos antes de ela começar a pós-stripe”, diz ele. “Boas ideias no momento certo e com uma boa equipe são muito raras. É tudo uma questão de execução, mas você pode executar uma má ideia em uma velocidade vertiginosa e ainda assim ser uma má ideia.”

A empresa de dois anos está atualmente levantando capital. mais de US$ 1 bilhãoQuando perguntei a ele sobre a pista, ele rapidamente revelou que não estava tão quente assim. A maior parte dos gastos vai para computação. Pouco depois, ele admitiu que, com as condições certas e o parceiro certo, poderia arrecadar mais dinheiro. “Realmente não há limite para quanto dinheiro você pode investir no trabalho”, diz ele. “Sempre há mais computação para resolver o problema.”

O que torna este acordo particularmente incomum é o que Groom não ofereceu aos seus apoiantes: um cronograma para transformar a inteligência física num esforço para ganhar dinheiro. “Não respondo à comercialização aos investidores”, diz ele sobre financiadores como Khosla Ventures, Sequoia Capital e Thrive Capital, que avaliaram a empresa em 5,6 mil milhões de dólares. “É meio estranho que as pessoas tolerem isso.” Mas eles toleram isso, e nem sempre é esse o caso. É por isso que é obrigatório que a empresa tenha capital suficiente agora. Não porque seja necessário, mas porque permite que sua equipe tome decisões de longo prazo sem concessões.

Quan Vuong, outro cofundador do Google DeepMind, explica que a estratégia gira em torno do aprendizado além do corpo e de diversas fontes de dados. Se alguém construir uma nova plataforma de hardware amanhã, não precisará começar a coletar dados do zero. Você pode transferir todo o conhecimento que seu modelo já possui. “O custo marginal de introduzir autonomia numa nova plataforma robótica é muito menor, independentemente da plataforma”, afirma.

A empresa já está a trabalhar com um punhado de empresas numa variedade de indústrias, incluindo logística, uma mercearia e o fabricante de chocolate do outro lado da rua, para testar se os seus sistemas são bons o suficiente para a automação no mundo real. Vuong argumenta que em alguns casos isso já acontece. Com uma abordagem “qualquer plataforma, qualquer tarefa”, o escopo para o sucesso é grande o suficiente para que você possa começar a verificar tarefas que estão prontas para automação hoje mesmo.

Não é apenas o intelecto físico que persegue esta visão. Semelhante ao modelo LLM que cativou o mundo há três anos, a corrida para construir inteligência robótica de uso geral está se intensificando, a base sobre a qual aplicações mais especializadas podem ser construídas. Skild AI, uma empresa sediada em Pittsburgh fundada em 2023, arrecadou US$ 1,4 bilhão em uma reunião neste mês. Avaliação de US$ 14 bilhões e adota uma abordagem marcadamente diferente. Embora a Inteligência Física permaneça focada na pesquisa pura, a Skild AI já implantou comercialmente seu Skild Brain “para todos os fins”, dizendo que gerou US$ 30 milhões em receitas em segurança, armazenamento e fabricação em apenas alguns meses no ano passado.

Skids também fotografou competidores em público. discutido no blog A maioria dos “modelos fundamentais da robótica” dependem muito do pré-treinamento em escala da Internet, em vez de simulações baseadas na física ou em dados robóticos reais, o que significa que são simplesmente modelos de linguagem visual “transformados” sem “verdadeiro bom senso físico”.

Essa é uma divisão filosófica bastante nítida. A Skild AI aposta que a implantação comercial criará um volante de dados que melhorará os modelos para cada caso de uso do mundo real. A Inteligência Física aposta que, ao resistir às tentações da comercialização a curto prazo, podemos criar uma inteligência geral superior. Levará anos para decidir o que é “mais correto”.

Enquanto isso, a inteligência física opera com o que Gloom descreve como uma clareza incomum. “É uma empresa muito pura. Os pesquisadores têm necessidades e coletamos dados para apoiar essas necessidades, e fazemos isso com novo hardware e seja lá o que for. Não é impulsionado externamente.” A empresa tinha um roteiro de cinco a 10 anos para definir o que a equipe considerava possível. Aos 18 meses, diz ele, eles estragaram tudo.

A empresa tem cerca de 80 funcionários e planeja continuar crescendo, mas Groom disse que espera fazê-lo “o mais lentamente possível”. A parte mais difícil, diz ele, é o hardware. “Hardware é realmente difícil. Tudo o que fazemos é muito mais difícil do que uma empresa de software.” Quebras de hardware. Chegue atrasado e o teste será atrasado. Tudo fica complicado quando você considera a segurança.

Observei os robôs continuarem praticando enquanto o noivo se levantava e corria para sua próxima missão. As calças ainda não estão dobradas. A camisa teimosamente permanece do lado direito para fora. Lascas de abobrinha estão bem empilhadas.

Há questões óbvias, inclusive eu, sobre se alguém realmente gostaria de usar um robô descascador de vegetais na cozinha, sobre segurança, sobre cães enlouquecendo quando as máquinas entram em casa e sobre se todo o tempo e dinheiro investidos aqui resolverão problemas suficientemente grandes ou criarão novos. Entretanto, quem está de fora tem dúvidas sobre o progresso da empresa, se a sua visão é alcançável e se faz sentido apostar na inteligência geral em vez de em aplicações específicas.

Mesmo que o noivo tenha dúvidas, ele não as demonstra. Ele está trabalhando com pessoas que trabalham nesse problema há décadas e acreditam que finalmente chegou o momento certo, e isso é tudo que ele precisa saber.

Além disso, o Vale do Silício tem apoiado pessoas como noivos desde os primórdios da indústria, dando-lhes muita corda. Mesmo que não tenham um caminho claro para a comercialização, mesmo que não tenham um cronograma, mesmo que não tenham certeza de como será o mercado quando chegarem lá, eles sabem que provavelmente descobrirão. Nem sempre dá certo, mas quando dá, tende a justificar muitas vezes que não dá.

Source link