Toque no aplicativo Antrópico Claude Olho Quando você digita “Conte-me uma história sobre gatos travessos” em seu telefone para receber o aviso, muita coisa acontece antes que o resultado (Roubo de Atum) apareça na tela.
Minha solicitação é enviada para a nuvem, um computador dentro de um computador. grande centro de dados Em algum lugar – a ser realizado através do Soneto 4.5 de Claude modelo de linguagem grande. O modelo usa texto altamente preditivo para montar respostas plausíveis com base em grandes quantidades de dados treinados. A resposta é enviada de volta ao meu iPhone e exibida palavra por palavra, linha por linha, na tela. Ele viajou centenas, senão milhares de quilômetros, e passou por vários computadores de e para meu pequeno celular. E tudo acontece em segundos.
leia mais: CNET escolhe os principais vencedores da CES 2026
Este sistema funciona bem quando o que você está fazendo é de baixo risco e a velocidade não é realmente um problema. Você pode esperar alguns segundos pela minha historinha sobre Whiskers e suas desventuras com armários de cozinha. Mas nem todas as tarefas de inteligência artificial são assim. Algumas coisas exigem uma velocidade tremenda. Quando um dispositivo de IA deseja alertar alguém sobre um objeto bloqueando seu caminho, ele não pode esperar um ou dois segundos.
Outras solicitações exigem mais privacidade. Não me importo se a história do meu gato passa por dezenas de computadores pertencentes a pessoas e empresas que não conheço e em quem não posso confiar. Mas e os meus dados financeiros e de saúde? Você pode querer manter isso sob controle.
Não perca nosso conteúdo técnico imparcial e análises baseadas em laboratório. Adicionar CNET Como fonte preferencial no Google.
Velocidade e privacidade são os dois principais motivos pelos quais os desenvolvedores de tecnologia estão migrando o processamento de IA de grandes data centers corporativos para dispositivos pessoais, como telefones celulares, laptops e smartwatches. Também economiza dinheiro. Você não precisa pagar taxas às principais operadoras de data center. Além disso, os modelos no dispositivo funcionam sem conexão com a Internet.
Mas permitir esta mudança requer melhor hardware e modelos de IA mais eficientes e muitas vezes mais especializados. A convergência desses dois fatores determina, em última análise, o quão rápida e perfeita será a experiência em dispositivos como telefones celulares.
Mahadev Satyanarayanan, conhecido como Sathya, é professor de ciência da computação na Carnegie Mellon University. Ele passou anos pesquisando o que é conhecido como edge computing, o conceito de processamento e armazenamento de dados o mais próximo possível dos usuários reais. Ele diz que o modelo ideal para a verdadeira computação de ponta é o cérebro humano, sem transferir tarefas como visão, percepção, voz e inteligência para qualquer tipo de “nuvem”. Tudo acontece na hora, totalmente “no seu dispositivo”.
“Aqui está o problema: a natureza levou um bilhão de anos para nos evoluir”, ele me disse. “Não podemos esperar mil milhões de anos. Estamos a tentar alcançar isto em cinco ou no máximo 10 anos. Como podemos acelerar a evolução?”
A velocidade vem de uma IA melhor, mais rápida e menor, executada em hardware melhor, mais rápido e menor. E como já estamos vendo com aplicativos e dispositivos modernos, incluindo eles também. Visto na CES 2026 –As coisas estão indo bem.
A IA provavelmente está rodando no seu telefone agora
A IA no dispositivo não é novidade. Lembra quando você conseguiu desbloquear seu iPhone pela primeira vez em 2017? segure-o na frente do seu rosto? Sua tecnologia de reconhecimento facial usava um mecanismo neural no dispositivo. Esta não é uma IA de última geração como Claude ou ChatGPT, mas é inteligência artificial básica.
O iPhone de hoje usa um modelo de IA no dispositivo mais poderoso e versátil. Possui cerca de 3 bilhões de parâmetros, que são cálculos individuais dos pesos dados às probabilidades do modelo de linguagem. Isso é relativamente pequeno em comparação com os grandes modelos de uso geral em que a maioria dos chatbots de IA são executados. Busca Profunda-R1por exemplo, 671 bilhões de parâmetros. Mas não foi feito para fazer tudo. Em vez disso, ele foi desenvolvido para tarefas específicas no dispositivo, como resumir mensagens. Semelhante à tecnologia de reconhecimento facial para desbloquear seu telefone, não pode depender de uma conexão com a Internet para executar o modelo na nuvem.
Apple aprimora recursos de IA no dispositivo inteligência da maçã — Inclui recursos de reconhecimento visual. Verifique do que você tirou uma captura de tela.
Os modelos de IA no dispositivo estão por toda parte. Os smartphones Pixel do Google rodam o modelo Gemini Nano da empresa em modelos personalizados. Chip tensor G5. Este modelo aprimora os seguintes recursos: sugestão mágicaCom o , as informações aparecem exatamente quando você precisa delas, em e-mails, mensagens e muito mais, sem precisar procurá-las manualmente.
Os desenvolvedores de telefones, laptops, tablets e do hardware que eles alimentam estão construindo seus dispositivos com a IA em mente. Mas vai além deles. Pense em relógios e óculos inteligentes, que têm espaço muito mais limitado do que o celular mais fino.
“Os desafios para os sistemas são muito diferentes”, disse Vinesh Sukumar, chefe de IA generativa e aprendizado de máquina da Qualcomm. “Posso realizar todas as operações em todos os dispositivos?”
Neste ponto, a resposta geralmente é “não”. A solução é muito simples. Quando as solicitações excedem a capacidade do modelo, as tarefas são transferidas para um modelo baseado em nuvem. Mas a forma como essa transferência é gerenciada pode prejudicar um dos principais benefícios da IA no dispositivo: manter os dados completamente em suas mãos.
IA mais privada e segura
Os especialistas apontam repetidamente a privacidade e a segurança como os principais benefícios da IA no dispositivo. Em ambientes de nuvem, os dados voam em todas as direções e expõem você a mais vulnerabilidades. É muito mais fácil mantê-lo seguro se você o mantiver em uma unidade criptografada em seu telefone ou laptop.
Os dados usados pelo modelo de IA do seu dispositivo podem incluir suas preferências, histórico de navegação, localização e muito mais. Tudo isso é essencial para que a IA personalize sua experiência com base em suas preferências, mas também são informações que você não quer que caiam em mãos erradas.
“O que procuramos é garantir que os usuários tenham acesso a esses dados e sejam os únicos proprietários deles”, disse Sukumar.
A Apple Intelligence deu um novo visual ao Siri no iPhone.
Existem várias maneiras de lidar com o descarregamento de informações para proteger a privacidade. Um fator importante é que você precisa dar permissão para fazer isso. Sukumar disse que o objetivo da Qualcomm é fornecer informações às pessoas para que possam dizer não quando um modelo chegar ao ponto de ser transferido para a nuvem.
Outra abordagem, que funciona junto com a solicitação de permissão do usuário, é garantir que os dados enviados para a nuvem sejam processados de forma segura, breve e temporária. Por exemplo, a Apple diz que a empresa computação em nuvem privada. Os dados descarregados são processados apenas nos próprios servidores da Apple, e apenas os dados mínimos necessários para a tarefa são enviados e nunca são armazenados ou acessados pela Apple.
IA sem custo de IA
Os modelos de IA executados no dispositivo têm uma vantagem tanto para os desenvolvedores de aplicativos quanto para os usuários, pois basicamente não têm custos de operação contínuos. Não existem empresas de serviços em nuvem que paguem por energia e poder computacional. Tudo está no seu telefone. Seu bolso é seu data center.
Foi isso que atraiu Charlie Chapman, desenvolvedor do aplicativo Noise Machine. ruído escuroaté usar o Foundation Models Framework da Apple como uma ferramenta que permite criar mixagens de sons. O modelo de IA no dispositivo não gera novo áudio, apenas seleciona uma variedade de sons e níveis de volume existentes para criar uma única mixagem.
A IA é executada no seu dispositivo, portanto não há custos contínuos ao criar seus mixes. Para pequenos desenvolvedores como Chapman, isso significa menos riscos associados ao tamanho da base de usuários de um aplicativo. “Se algum influenciador postar aleatoriamente sobre isso e conseguir um número incrível de usuários gratuitos, isso não significa que de repente vou à falência”, disse Chapman.
leia mais: Fundamentos da IA: 29 maneiras de aproveitar a Gen AI com nossos especialistas
Como a IA no dispositivo não tem custos contínuos, Chapman disse que ela pode automatizar tarefas pequenas e repetitivas, como entrada de dados, sem a necessidade de grandes custos ou contratos de computação. A desvantagem é que os modelos do dispositivo variam dependendo do dispositivo, então os desenvolvedores precisam trabalhar mais para garantir que seus aplicativos funcionem em hardware diferente.
Quanto mais tarefas de IA forem realizadas pelos dispositivos de consumo, menos as empresas de IA terão de gastar na construção de enormes centros de dados competindo por financiamento e chips de computador. “O custo da infraestrutura é enorme”, disse Sukumar. “Se você realmente deseja escalar, não quer impor a carga de custos.”
Os criadores que usam IA para edição de vídeos e fotos têm a vantagem de executar esses modelos em seu próprio hardware, evitando assinaturas caras e taxas de uso baseadas na nuvem. Na CES. nós vimos isso Computador dedicado ou dispositivo especialcomo Nvidia DGX Sparkpode alimentar modelos de geração intensiva de vídeo, como: Lighttrix-2.
O futuro é tudo uma questão de velocidade
Grande parte da verdadeira utilidade da IA e do aprendizado de máquina, especialmente quando se trata da funcionalidade de dispositivos como óculos, relógios e telefones, é diferente dos chatbots que usamos para falar com gatos no início deste artigo. Isso inclui reconhecimento de objetos, navegação e tradução. Eles exigem modelos e hardware mais especializados, mas também exigem mais velocidade.
Sathya, professor da Carnegie Mellon University, estuda os vários usos dos modelos de IA e se eles podem operar com precisão e rapidez suficiente usando modelos no dispositivo. Quando se trata de classificação de imagens de objetos, a tecnologia atual funciona muito bem e pode fornecer resultados precisos em 100 milissegundos. “Cinco anos atrás, não havia nenhum lugar onde se pudesse obter esse tipo de precisão e velocidade”, disse ele.
Captura de tela recortada de vídeo filmado com óculos Oakley Meta Vanguard AI mostrando métricas de treino obtidas de um relógio Garmin emparelhado.
Mas para quatro outras tarefas: detecção de objetos, segmentação instantânea, reconhecimento de atividades e rastreamento de objetos, o dispositivo deve ser transferido para um computador mais poderoso em outro lugar.
“Acho que será uma situação muito emocionante nos próximos anos, talvez cinco anos, à medida que os fornecedores de hardware continuam a se esforçar para alinhar melhor os dispositivos móveis com a IA”, disse Satya. “Ao mesmo tempo, os próprios algoritmos de IA estão se tornando mais poderosos, mais precisos e exigem mais poder computacional.”
As oportunidades são imensas. Satya disse que dispositivos futuros poderiam usar a visão computacional para avisá-lo antes que os pagamentos se tornem irregulares, lembrá-lo com quem você está falando e fornecer contexto sobre comunicações anteriores com essa pessoa. Coisas como essa exigem IA mais especializada e hardware mais especializado.
“Eles surgirão”, disse Sathya. “Eu os vejo no horizonte, mas eles ainda não chegaram.”


















