A OpenAI está apostando alto na IA de áudio, mas não se trata apenas de melhorar o som do ChatGPT. De acordo com novo relatório De acordo com The Information, a empresa tem integrado várias equipes de engenharia, produto e pesquisa nos últimos dois meses para revisar seu modelo de áudio em preparação para seu primeiro dispositivo pessoal de áudio, que deverá ser lançado em cerca de um ano.
A mudança reflete o rumo que toda a indústria tecnológica está tomando: um futuro onde as telas serão o ruído de fundo e o áudio será o centro das atenções. Alto-falantes inteligentes já instalaram assistentes de voz em mais de um terço dos lares americanos. metajusto Expandimos a funcionalidade Os óculos inteligentes Ray-Ban da empresa usam um conjunto de cinco microfones para ajudá-lo a ouvir conversas em salas barulhentas, essencialmente transformando seu rosto em um dispositivo de escuta direcional. Enquanto isso, em junho, o GoogleVisão geral do áudioE a Tesla está integrando Grok e outros LLMs em seus veículos para criar assistentes de voz conversacionais que podem lidar com tudo, desde navegação até controle climático por meio de interações naturais.
Não são apenas os gigantes da tecnologia que fazem esta aposta. Uma grande variedade de startups surgiu com as mesmas crenças, embora com graus variados de sucesso. Os criadores do Humane AI Pin gastaram centenas de milhões de dólares antes que o wearable sem tela se tornasse popular. conto preventivo. O pingente Friend AI, um colar que registra sua vida e proporciona companheirismo, levantou preocupações com privacidade e medos existenciais. medida igual. E agora inclui pelo menos duas empresas. banco de areia E aquele dirigido pelo fundador do Pebble Eric Migikowskiestá construindo um anel de IA com estreia prevista para 2026 que permite ao usuário literalmente falar com as mãos.
Os formatos podem ser diferentes, mas o argumento é o mesmo: o áudio é a interface do futuro. Cada espaço está se tornando uma interface: sua casa, seu carro e até seu rosto.
O novo modelo de áudio da OpenAI, previsto para o início de 2026, terá um som mais natural, lidará com interrupções como um verdadeiro interlocutor e permitirá que você fale durante uma conversa, algo que os modelos atuais não conseguem fazer. A empresa também está imaginando uma família de dispositivos que funcionariam mais como companheiros do que como ferramentas, possivelmente incluindo óculos e alto-falantes inteligentes sem tela.
Como aponta o The Information, o ex-chefe de design da Apple, Jony Ive, disse que a empresa Aquisição de US$ 6,5 bilhões Em maio, sua empresa io priorizou a redução do vício em dispositivos, vendo o design que prioriza o áudio como uma oportunidade para “corrigir os erros” dos dispositivos de consumo do passado.


















