Se você consegue digitar ou falar, provavelmente consegue. código de vibração. É muito fácil. Basta comunicar suas idéias a outras pessoas. Bot de bate-papo com IA Selecionar em linguagem natural faz com que funcione. Embora nem todo projeto possa acabar sendo uma jóia perfeita no final, nem seja totalmente funcional, criar um aplicativo da web com apenas um bate-papo requer um esforço mínimo.

Tenho brincado bastante com o Vibe Coding, criando projetos aleatórios aqui e ali. Tenho brincado com isso principalmente para fins de prova de conceito e testes de chatbot, mas raramente tentei fazer algo importante ou funcional o suficiente para usar diariamente. Comecei então a procurar um leitor eletrônico e saí frustrado com o quão incrivelmente “estúpidos” a maioria deles era, especialmente o Kindle. Mais sobre isso mais tarde.

Atlas de IA

Seja qual for a motivação (mas principalmente foi um ato de rebelião contra a Amazon), isso me inspirou a criar uma versão modificada do Vibe Code. Eu queria ver se conseguiria codificar um aplicativo de e-book funcional com todos os recursos de que precisava. Eu sabia que, mesmo que colocasse isso em funcionamento, não o usaria todos os dias, mas queria adicionar um pouco mais de estilo a ele.

A questão passou a ser qual chatbot de IA usar. Não me preocupei em escolher. Usei Gemini, Claude e ChatGPT para criar o que precisava e ver qual deles produz melhores resultados.

incitar

Comparar chatbots é difícil, especialmente quando se tenta imitar as mesmas conversas ou projetos de codificação de humor. acredite em mim, Eu tentei. Eu queria ter certeza de que todas as ferramentas que testei usavam o mesmo prompt, mas primeiro queria refinar esse prompt para obter os melhores resultados, então criei uma estratégia para chegar lá.

Primeiro, usamos o Gemini para construir todo o projeto em seu nível mais básico. Assim que gostei do que estava acontecendo com o projeto (a prova de conceito foi bem-sucedida e estava funcionando), pedi que criassem um prompt para que eu pudesse adicioná-lo a outros chatbots. Gemini gerou um prompt e eu o salvei como um arquivo e carreguei para Claude. Passei por esse processo novamente para ajudar Claude a encontrar e consertar coisas que não havia pensado ao construir o projeto e o Gemini. Assim que o processo foi concluído, pedi que criassem outro prompt para que eu pudesse adicioná-lo ao ChatGPT.

A ideia era fornecer informações aos três chatbots sobre a criação real do projeto e fazer com que eles inserissem o prompt final. Depois que o prompt foi criado, carreguei-o em todos os três chatbots em chats separados para ver quão consistente era seu desempenho.

Projeto: O Leitor de Tomos

Este projeto nasceu da minha frustração com os dispositivos Kindle da Amazon. Se você gosta de ler ou ouvir seus próprios livros, pode fazer isso com destaque em tempo real em um aplicativo iOS ou Android, mas há quase 20 anos, você não pode fazer isso no seu Kindle. Na verdade, não faz muito tempo que os usuários conseguiam realçar texto em tempo real com a reprodução do leitor auxiliar, o que é muito próximo do que os aplicativos fazem. Atualmente, você só pode ler ou ouvir audiolivros no Kindle, mas não em ambos. Isso foi engraçado, mas também foi a ideia de a Amazon ser dona de todos os meus livros. Comecei a pensar que talvez pudesse simplesmente codificar a solução. Eu chamo isso de “Leitor de Tomos”.

Eu queria criar um aplicativo web de e-reader imersivo que pudesse ler livros em voz alta para você, quer você colasse texto ou carregasse seus próprios arquivos PDF ou EPUB (com destaque de texto em tempo real, é claro). Além de ler o texto em voz alta, o aplicativo da web cria música de fundo dependendo do conteúdo do texto em um subconjunto de categorias (Neutro, Terror Gótico, Ficção Científica, Natureza, Fantasia, Subaquático, Ocidental, Mistério) e gera efeitos sonoros e visuais adicionais quando certas palavras-gatilho são faladas em tempo real. Todo o projeto é criado em um único arquivo HTML, para que possa ser executado em um navegador da web sem dependências adicionais.

Construindo com chatbots: Rodada 1

Gêmeos

Projeto Vibe Coding - Leitor de Livros - Gêmeos

Gemini alcançou todos os recursos que eu queria em um Tomb Reader com relativa facilidade.

Captura de tela feita por Google/Blake Stimac

Graças ao Gemini, agora podemos ver até que ponto podemos estender a funcionalidade deste aplicativo web. Como tal, a maior parte da sua funcionalidade vem do chatbot do Google. Isso nos permitiu resolver os primeiros pequenos problemas que impediam o carregamento do áudio TTS. Em vez disso, criei uma tela de inicialização que força o carregamento do áudio após clicar na tela “Abrir” do aplicativo. Sem esse tipo de conhecimento o projeto não teria decolado.

Lenta mas seguramente, a funcionalidade do projeto começou a se expandir. Os efeitos sonoros ao vivo para certas palavras podem distrair, por isso adicionamos uma opção para desligar esses efeitos sonoros e música de fundo. Assim que a base do nosso aplicativo funcionou, pedimos ao Gemini que criasse prompts que pudessem ser compartilhados com outros chatbots para que pudessem ser construídos em outro lugar, se necessário. E funcionou.

Cláudio

Projeto Vibe Coding - Leitor de livros - Claude

O projeto de Claude foi meu favorito dos três projetos de teste, embora tenha sido o mais bem-sucedido em algumas áreas e apresentado mais problemas em outras.

Humano/Captura de tela: Blake Stimac

Claude fez grandes melhorias na funcionalidade fundamental das palavras-gatilho neste projeto. Claude expandiu seu vocabulário e fortaleceu sua visualização de quando a palavra-gatilho é dita em voz alta. Dito isto, certamente faz sentido logicamente, mas Claude me ligou sem que eu perguntasse.
Inicialmente, pensei que este projeto não estava funcionando bem. Quando tentei testar o recurso, a primeira palavra-gatilho sozinha criou o efeito desejado entre quase 10 strings. Demorou um pouco para Claude finalmente revelar que decidiu permitir que efeitos sonoros e visuais fossem acionados apenas uma vez por frase para evitar “spam” aos usuários. Isso fazia muito sentido, mas o projeto era mais uma prova de conceito do que um leitor funcional, e Gemini e ChatGPT geravam efeitos sonoros para cada palavra-chave, o que era um recurso esperado.

Dito isto, não havia instruções específicas no prompt sobre quantas vezes os sons e efeitos visuais deveriam ser reproduzidos. Não era necessariamente o que eu queria, mas apreciei a consideração dada à experiência geral do usuário ao fazer tais chamadas. Então, depois de codificar todas essas melhorias, Claude atualizou o prompt e eu trouxe para o ChatGPT.

Bate-papo GPT

Projeto de codificação Vibe - Leitor de livros - ChatGPT

O ChatGPT ocasionalmente falhava quando solicitado a criar recursos adicionais, mas era capaz de recriar completamente o projeto quando recebia uma solicitação final.

OpenAI/Captura de tela de Blake Stimac

No momento em que criei o prompt atualizado no Claude, não havia muito mais que eu pudesse fazer ao carregá-lo no ChatGPT. Felizmente, o chatbot da OpenAI foi o mais lento para gerar código, mas foi fácil de criar projetos. Um dos recursos que pedi ao ChatGPT para adicionar ao projeto, a capacidade de criar um controle deslizante de volume apenas para música de fundo que poderia ser desligado completamente se você quisesse apenas uma experiência de leitura apenas de e-book, falhou consistentemente. Eventualmente, voltei para Claude e pedi esse recurso, e ele recriou o prompt.

Rodada 2: Recrie o mesmo projeto

Apesar de inicialmente usar o Gemini 3 Pro para construir o projeto e usar as versões gratuitas do ChatGPT e Claude, nós três criamos o projeto, mas não foi isento de problemas. Passei a maior parte do tempo refinando o projeto com Claude, e Claude foi responsável pela criação da versão final. Então foi uma grande surpresa saber que quando carreguei aquele prompt em um novo chat, o projeto não carregava além da página inicial de “inicialização”. Foram necessárias mais 11 (sim, realmente) reconstruções completas para descobrir o que estava acontecendo, embora a iteração anterior não tivesse tido nenhum problema.

Recriei o projeto usando Gemini e ChatGPT e funcionou bem. Todos os recursos básicos e avançados funcionaram bem, incluindo upload de arquivos, destaque de teste, saída de texto para fala e efeitos de áudio e visuais quando a palavra acionadora é dita em voz alta. Voltando ao modelo, dar a cada chatbot as mesmas instruções fez pouca diferença na funcionalidade ou no desempenho.

Incompatibilidade do chatbot

Obter arquivos para teste sempre foi fácil com Claude. Ele não apenas fornece uma prévia do projeto, para que você não precise baixar o arquivo HTML, mas agora você pode baixá-lo diretamente, se desejar (o que fiz frequentemente para testes). Às vezes, essa opção só estava disponível no ChatGPT, outras vezes você só podia copiar o HTML e salvá-lo você mesmo.

Mesmo que Gêmeos tivesse o menor número de erros e ansiedade geral, sempre foi necessário percorrer o caminho mais longo e fazer assim. Além disso, o fato de o ChatGPT apenas ocasionalmente oferecer permissão para baixar arquivos diretamente como HTML era estranho e um pouco frustrante.

Vencedor: Depende.

É difícil definir um vencedor neste tipo de teste, pois todos os chatbots têm pontos fortes e fracos. De certa forma, todos ganham. Cada um foi capaz de criar uma versão funcional do projeto em algum momento, mas muitas vezes exigiu esforços iterativos.

No final, o vencedor é o usuário. Isso mostra que, independentemente do modelo utilizado, um conjunto sólido de etapas pode levar você longe. Não conseguimos discernir diferenças de desempenho ou recursos entre os aplicativos criados com Gemini 3 Pro e as versões gratuitas do ChatGPT ou Claude.

Na verdade, isso vai diretamente contra o que descobri ao ter conversas semelhantes com os modelos Gemini Pro e Free. Foi outro dia, outro projeto, outro modelo, mas descobri que, com instruções sólidas, você pode ir incrivelmente longe no mundo da codificação vibratória.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui