codificação de vibração Pode ser muito divertido se você tiver a mentalidade certa. Você não precisa ser um engenheiro para ter uma grande ideia com potencial para criar algo incrível. É isso que torna a criação de aplicativos usando apenas linguagem natural tão atraente e acessível a todos. Eu mesmo me envolvi com uma boa quantidade de codificação de vibração. calendário de eventos e reconstruir videogames infantis Basta conversar no seu navegador chatbotmas sabemos que apenas arranhamos a superfície.

Atlas de IA

CNET

O modelo que você usa pode ter um impacto dramático na qualidade do resultado do seu projeto, e eu testemunhei isso em primeira mão. Eu queria ver como os modelos leves se comparam ao que o Google e a OpenAI chamam de modelos “pensantes”. Os nomes desses modelos leves variam. A interface Gemini do Google o chama de Fast (embora esse modelo seja na verdade chamado de Gemini 2.5 Flash). OpenAI É chamado de instantâneo.

Para descobrir o quão diferente é cada modelo de codificação de vibração, realizamos um experimento. Comecei criando um projeto usando o Modelo de Pensamento do Gemini (Gemini 3 Pro) e queria ver se conseguia replicar o mesmo projeto com o modelo rápido usando os mesmos prompts do projeto anterior. Dado que não havia forma de garantir a resposta de cada modelo, sabíamos que haveria variações e as conversas divergiriam, mas na maior parte tentámos manter as conversas o mais idênticas possível.

No momento deste teste, o modelo mais rápido era o Gemini 2.5 Flash. Esperava que o resultado final fosse diferente, e não foi, mas não tanto quanto eu esperava. O que foi diferente foi como cada modelo passou de A a Z.

Faltou-me inspiração para esta experiência, então deixei para Gêmeos. Pedi a eles que criassem um projeto interessante de codificação de vibração que pudessem fazer e escolhi algo chamado “expositor de troféus”. Pedi ao Gemini que exibisse uma lista de filmes de terror em vez de troféus e fornecesse mais informações sobre o filme de terror ao clicar em um dos pôsteres. Além desses requisitos, dei controle criativo a ambos os modelos Gemini.


Não perca nosso conteúdo técnico imparcial e análises baseadas em laboratório. Adicionar CNET Como fonte preferencial no Google.


Modelos rápidos de IA e modelos de IA pensantes: Qual é a diferença?

Se o Google pudesse escolher entre um modelo Flash e um modelo Pro, eles seriam substancialmente diferentes. Sim e não. Ambos são grandes modelos de linguagem, mas operam de maneiras diferentes. Para usuários comuns, “velocidade” e “pensamento” são suficientes para definir a diferença entre os dois: velocidade e profundidade.

um modelo de inferência é um LLM que foi ajustado para dividir problemas complexos em etapas menores antes de produzir o resultado final. Isso é feito executando uma cadeia interna de caminhos de raciocínio de pensamento. Gemini 2.5 Flash e Gemini 3 Pro são modelos de inferência, mas Gemini 2.5 Flash abordagem híbrida: fornece. ato de equilíbrio Entre velocidade e lógica.

Gemini 3 Pro é um modelo de inferência mais poderoso, otimizado para se aprofundar na busca de respostas. Como resultado, é mais lento que modelos mais eficientes, como o flash 2,5. Desde então, o Google lançou flash de gêmeos 3um modelo básico mais poderoso que substitui o Flash 2,5. O Gemini 3 Pro continua sendo o modelo de inferência mais poderoso disponível no Gemini para a maioria das pessoas.

O modelo Gemini 3 Pro fez a maior parte do trabalho

Projeto de filme de codificação Gemini 3 Pro Vibe

O projeto final criado pelo Gemini 3 Pro não foi perfeito, mas foi melhor do que minha ideia original e cerca de um quilômetro à frente do que o Gemini 2.5 Flash criou.

Google Gemini/Captura de tela de Blake Stimac/CNET

Usando o Gemini 3 Pro, consegui criar uma landing page para mostrar os filmes da minha lista e até adicionar uma imagem de pôster. Clique no título para abrir uma página com informações adicionais e um link para assistir ao trailer no YouTube. Não foi um projeto complicado, mas encontrei muitos problemas e erros ao longo do caminho.

Originalmente, queríamos incorporar o trailer na página, mas o Gemini continuava sinalizando erros que não conseguia corrigir, então decidimos reduzi-lo para fornecer apenas uma imagem de link para assistir ao trailer no YouTube. Foi bom, mas não foi uma experiência tão perfeita quanto eu esperava. Dito isto, apreciei a explicação detalhada dos problemas específicos que o Gemini 3 Pro teve com esse recurso que levaram à decisão de descontinuá-lo.

Outro problema que o Gemini 3 Pro tentou corrigir várias vezes foi algo chamado problema de camadas. Ao clicar no pôster, você recebe um pop-up com detalhes sobre o filme e um pequeno botão para sair dessa visualização, mas na verdade não funcionou. Solicitei ao Gemini que corrigisse esse problema 4 vezes e eles não conseguiram resolver o problema até a última solicitação. Gemini deu uma explicação de alto nível sobre o que estava fazendo com o código, mas não entrou em muitos detalhes. No entanto, acredito que eles teriam dado mais detalhes se eu tivesse perguntado.

O projeto original era simplesmente uma forma de ver uma coleção de filmes e obter mais informações sobre eles. Fora isso, eu realmente não pensei em estilo ou em como tornar os aplicativos da web interessantes, mas o Gemini 3 Pro me ajudou nessa área. Quando perguntamos como poderíamos melhorar o aplicativo, tanto em design quanto em funcionalidade, eles sugeriram adicionar um efeito de roda 3D aos filmes e adicionar uma opção de seleção aleatória.

Este projeto levou quase 20 iterações. O produto final ficou tão bom quanto eu esperava e foi um projeto divertido, mas havia problemas frequentes que o Gemini não conseguia resolver. O produto final superou minhas expectativas e estou satisfeito. Mas, dados todos os problemas que encontrei, comecei a me perguntar como o modelo Gemini mais rápido lidaria com o mesmo projeto.

A codificação Gemini 2.5 Vibe com Flash torna-se mais manual

Não é novidade que usar o modelo “Rápido” foi mais rápido que o Gemini 3 Pro, mas em muitos casos esse modelo exigia uma abordagem mais manual para encontrar uma solução para um projeto. A IA funcionou rapidamente, mas criou um trabalho cada vez mais lento para mim.

Por exemplo, eu queria exibir o pôster e a sinopse de cada filme da lista em meu aplicativo web, mas não tinha ideia de como essas informações seriam geradas. Sem realmente perguntar, o Gemini 3 Pro sugeriu que eu me inscrevesse. banco de dados de filmes E obtenha uma chave de API para preencher automaticamente esses detalhes. Agora o Gemini 2.5 Flash basicamente disse para ele “agarrar” a imagem e começar a partir daí. Parecia que cabia a mim como conseguir essas imagens.

O Gemini 2.5 Flash pode quase parecer preguiçoso quando comparado ao Gemini 3 Pro. Embora o modelo Gemini Pro possa fazer algumas coisas sem ser solicitado, o Flash requer instruções mais específicas. Às vezes, parecia que eu estava cutucando uma criança que evitava tarefas intencionalmente, apesar de ouvir as instruções.

Em vários casos, depois que pedi ao Gemini 2.5 Flash para fazer alterações, o Gemini 2.5 Flash fez as alterações e forneceu código atualizado, mas apenas em determinadas seções. Você será solicitado a substituir o código antigo pelo novo. Substituir uma seção de código por outra provavelmente não é um grande problema se você souber o que está procurando. Mas isso é codificação de humor, e não saber onde colocar o código pode fazer com que algumas pessoas parem no processo, mesmo que seja uma tarefa muito fácil. Isso pode arruinar a atmosfera.

Além disso, o Gemini 2.5 Flash simplesmente se ofereceu para “obter” a imagem do pôster do filme e detalhes adicionais. Então decidi quebrar os parâmetros experimentais de usar apenas os mesmos prompts para ambos os projetos (que eram, na melhor das hipóteses, frouxos) e perguntar ao Gemini 2.5 Flash o que eles acharam da ideia de adicionar uma chave de API ao The Movies Database. A empresa acolheu a ideia e me disse onde adicionar a chave. Em vez disso, pedi ao modelo para adicionar a chave que forneci. A chave foi adicionada, mas quando executei o aplicativo da web, ele não recuperou as imagens do pôster dos filmes que listei, então tive que pedir que corrigissem o problema novamente. O modelo sugeriu suas limitações dizendo: “Leva tempo para encontrar os IDs exatos do TMDB de todos os filmes na lista original, mas preenchemos a matriz com tantos IDs verificados quanto possível para criar uma coleção que corresponda exatamente à lista solicitada”.

Se fez alguma coisa, eu não percebi. Comparado ao grande número de filmes diferentes, qualquer coisa que correspondesse à lista que forneci parecia uma coincidência. Ainda assim, mesmo que 99% dos pôsteres de filmes exibidos estivessem incorretos, em teoria não havia necessidade de adicionar manualmente as próprias imagens. Em contraste, o Gemini 3 Pro foi capaz de criar todos os pôsteres de filmes corretos de uma só vez.

Diferença entre modelo rápido e modelo de pensamento durante a codificação de vibração

Cada vez que você solicita um ajuste no modelo de pensamento do Gemini, alterações são feitas e todo o código é reescrito imediatamente, então você pode simplesmente copiar e colar todo o código onde precisar, sem precisar saber onde o código foi atualizado.

O Gemini 2.5 Flash era diferente. Em algum momento, depois de fazer alguns pequenos ajustes, recebi um código e fui instruído a substituí-lo pelo que estava lá. Para evitar isso, pedi que reescrevessem todo o código para que nada precisasse ser alterado. A resposta é: “Essa é uma grande questão”. Parecia que eles acreditavam que eu estava pedindo mais naquele momento, mas comparado ao Gemini 3 Pro, é um pouco desanimador.

projeto

Projeto de filme de codificação Gemini 2.5 Flash Vibe

O Gemini 2.5 Flash produziu um projeto um tanto funcional, mas estava repleto de erros mesmo quando tentei corrigi-los.

Google Gemini/Captura de tela de Blake Stimac/CNET

No final dos nossos testes, nenhum dos modelos estava perfeito, mas trabalhar com o Gemini 3 Pro foi muito mais fácil. Ambos os modelos podem produzir resultados muito semelhantes em projetos diferentes, mas podem seguir dois caminhos muito diferentes para chegar ao destino final.

Ao usar o Gemini 2.5 Flash, você precisa ser específico sobre o que deseja fazer e ser capaz de consertar se parecer que está usando um atalho. Identificar quando um modelo está tomando atalhos que podem impactar seu projeto requer prática e experiência, incluindo trabalhar com outros modelos de IA. Se este for o seu único modelo, você terá que trabalhar mais no geral.

Gemini 3 Pro realmente faz jus ao seu nome. Eles não apenas cuidaram do trabalho pesado deste projeto, mas também forneceram sugestões úteis para melhorar o projeto a partir da ideia básica com a qual comecei.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui