O Lord Institute anunciou na quinta-feira. Primeiro lote de subsídios Slingshotsque visa “avançar a ciência e a prática da inteligência artificial”.

Projetado como um acelerador para pesquisadores, o programa Slingshots visa fornecer recursos não disponíveis na maioria dos ambientes acadêmicos, incluindo financiamento, poder computacional e suporte de produtos e engenharia. Em troca, o destinatário promete criar algum tipo de produto final, seja uma startup, uma base de código aberto ou outro tipo de trabalho.

O grupo inicial é de 15 projetos, com foco particular no difícil problema da avaliação de IA. Alguns desses projetos podem ser familiares aos leitores do TechCrunch. banco de terminais de benchmark de codificação de linha de comando e a versão mais recente Projeto ARC-AGI de longo prazo.

Outros adotam novas abordagens para problemas de avaliação há muito estabelecidos. O Formula Code, desenvolvido por pesquisadores do Instituto de Tecnologia da Califórnia e da Universidade do Texas em Austin, visa avaliar a capacidade de um agente de IA de otimizar o código existente, enquanto o BizBench, com sede em Columbia, propõe uma referência abrangente para “agentes de IA de colarinho branco”. Outras bolsas exploram novas estruturas para aprendizagem por reforço ou compressão de modelos.

Banco SWE O cofundador John Boda Yang também faz parte do grupo, liderando o novo projeto CodeClash. Inspirado no sucesso do SWE-Bench, o CodeClash avalia o código por meio de uma estrutura dinâmica baseada em competição. Yang espera que sim.

“Acho que impulsionará o progresso se as pessoas continuarem a avaliar os principais benchmarks de terceiros”, disse Yang ao TechCrunch. “Estou um pouco preocupado com um futuro em que os benchmarks se tornarão específicos da empresa.”

Source link