Quando perguntado Yan LeCunO Vale do Silício tem um problema de pensamento de grupo. Desde que deixou Meta em novembro, o pesquisador e luminar da IA definir o objetivo A visão ortodoxa é que os modelos de linguagem em larga escala (LLMs) nos levarão à inteligência artificial geral (AGI), o limiar no qual os computadores igualam ou excedem a inteligência humana. Senhoras e senhores, ele declarou: entrevistas recentesestão sendo administrados “comprimidos LLM”.

21 de janeiro, startup Logical Intelligence, com sede em São Francisco LeCun nomeado diretor. Baseie-se na teoria inventado por Lekan Há vinte anos, a startup afirmou ter desenvolvido uma forma diferente de IA com capacidade de aprender, raciocinar e autocorrigir.

A Inteligência Lógica desenvolveu o que é conhecido como Modelo de Raciocínio Baseado em Energia (EBM). Embora o LLM preveja efetivamente a próxima palavra mais provável em uma sequência, o EBM absorve um conjunto de parâmetros (por exemplo, regras do Sudoku) e conclui a tarefa dentro desse intervalo. Este método deve envolver menos tentativa e erro, eliminar erros e exigir muito menos computação.

O fundador e CEO Yves Bodnia disse em entrevista à WIRED que o modelo de estreia da startup, Kona 1.0, pode resolver quebra-cabeças de Sudoku muitas vezes mais rápido do que o LLM líder mundial, apesar de rodar apenas em uma única GPU Nvidia H100. (Para este teste, os LLMs são impedidos de usar recursos de codificação que lhes permitem “forçar a força bruta” nos quebra-cabeças.)

A Logical Intelligence afirma ser a primeira empresa a construir um EBM funcional, mas até agora era apenas uma fantasia acadêmica. O objetivo é que Kona resolva problemas complexos, como a otimização de redes de energia e a automatização de processos de fabricação avançados em ambientes onde não há espaço para erros. “Nenhuma dessas tarefas está relacionada à linguagem; elas nada mais são do que linguagem”, diz Bodnia.

Bodnia espera que a Logical Intelligence trabalhe em estreita colaboração com a AMI Labs, uma startup com sede em Paris que a LeCun lançou recentemente. AMI Labs está desenvolvendo mais uma forma de IA, o chamado modelo mundial, que visa perceber dimensões físicas, demonstrar memória persistente e prever os resultados das ações. O caminho para a AGI começa com a estratificação desses diferentes tipos de IA, argumenta Bodnia. O LLM interage com humanos em linguagem natural, o EBM assume tarefas de inferência e o modelo mundial ajuda o robô a agir no espaço 3D.

Bodnia conversou com a WIRED esta semana por videoconferência em seu escritório em São Francisco. A entrevista a seguir foi editada para maior clareza e extensão.

WIRED: Deixe-me perguntar sobre Jan. Conte-nos como nos conhecemos, seu papel na condução da pesquisa na Logical Intelligence e seu papel no conselho.

Bódnia: Embora Yang tenha uma vasta experiência acadêmica como professor na Universidade de Nova York, ele teve contato com a indústria real por meio de Mehta e outros colaboradores ao longo dos anos. Ele viu os dois mundos.

Para nós, ele é o único especialista em modelos baseados em energia e nos diferentes tipos de arquiteturas envolvidas. Quando começamos a trabalhar neste EBM, ele era a única pessoa com quem eu conseguia conversar. Ele ajuda nossa equipe técnica a avançar em uma direção específica. Ele era muito prático. Não consigo imaginar que cresceremos tão rápido sem Jan.

Yang fala abertamente sobre as limitações potenciais do LLM e quais arquiteturas de modelo têm maior probabilidade de avançar na pesquisa de IA. onde você está?

LLM é um jogo de muita adivinhação. Portanto, requer uma grande quantidade de computação. Ele usa uma rede neural, alimenta quase todo o lixo da internet e tenta ensinar as pessoas a se comunicarem umas com as outras.

Quando você fala, sua linguagem é intelectual para mim, mas não é culpa da linguagem. A linguagem é uma expressão do que está em seu cérebro. Meu raciocínio acontece em algum tipo de espaço abstrato e eu o decifro em linguagem. Sinto que as pessoas estão tentando fazer engenharia reversa da inteligência, imitando a inteligência.

Source link