Antrópico está atolado em contradições. Entre as principais empresas de IA, mais obcecado Estamos liderando o caminho para garantir a segurança e estudar como os modelos dão errado. No entanto, mesmo que questões de segurança A Anthropic está avançando tão agressivamente quanto seus concorrentes em direção ao próximo e potencialmente mais perigoso nível de inteligência artificial. A sua missão central é encontrar uma forma de resolver essa contradição.
No mês passado, a Anthropic divulgou dois documentos. Cada um reconhece os riscos associados ao caminho em que estamos actualmente e sugere possíveis rotas para escapar ao paradoxo. “adolescência da tecnologiaUma longa postagem no blog do CEO Dario Amodei, nominalmente sobre “confrontar e superar os riscos da poderosa IA”, dedica mais tempo ao primeiro do que ao último. Embora Amodei descreva habilmente o desafio como “assustador”, a sua descrição dos riscos da IA torna-se mais terrível devido ao elevado potencial de utilização indevida da tecnologia por autoritários, em contraste com os seus antecessores mais optimistas. Ensaio Utópico Primitivo “máquina de misericórdia”
Nesse post eu estava falando sobre uma nação de gênios dentro do data center. Despachos recentes trazem à mente um “mar negro infinito”. A paginação de Dante! Ainda assim, depois de dizer mais de 20.000 palavras, na sua maioria obscuras, Amodei finalmente assumiu um tom optimista, dizendo que mesmo nas circunstâncias mais sombrias, a humanidade sempre prevaleceu.
O segundo documento Antrópico, publicado em janeiro, “constituição de claude“” foca em como esse truque é realizado. Este texto é tecnicamente direcionado ao público do próprio Claude (e de versões futuras do chatbot). É um documento fascinante que revela a visão da Anthropic sobre como Claude, e talvez os seus companheiros de IA, irão enfrentar os desafios do mundo. Resumindo: a Anthropic planeja contar com o próprio Claude para desatar o nó górdio corporativo.
O diferencial de mercado da Antrópico sempre foi uma tecnologia chamada . Constituição IA. Este é um processo pelo qual um modelo segue um conjunto de princípios que alinham seus valores com uma ética humana sólida. A antiga Constituição de Claude continha muitos documentos destinados a incorporar estes valores. Sparrow (uma série de declarações antirracismo e antiviolência criadas pela DeepMind), a Declaração Universal dos Direitos Humanos, os Termos de Serviço da Apple (!) e muito mais. A versão atualizada para 2026 é diferente. É como um longo prompt delineando a estrutura ética que Claude segue enquanto descobre por si mesmo o melhor caminho para a justiça.
Amanda Askell, Ph.D., autora principal desta edição revisada, explica que a abordagem da Anthropic é mais robusta do que simplesmente dizer a Claude para seguir um conjunto de regras prescritas. “Quando as pessoas seguem uma regra sem nenhuma outra razão além da razão pela qual a regra existe, as coisas são muitas vezes piores do que se entendessem por que a regra existe”, explica Askel. A constituição exige que Claude exerça um “julgamento independente” quando confrontado com situações em que deve equilibrar os imperativos de utilidade, segurança e integridade.
A Constituição dispõe o seguinte: “Queremos que Claude seja racional e rigoroso ao pensar claramente sobre ética, mas também queremos que ele seja intuitivamente sensível a uma variedade de considerações e capaz de pesar essas considerações de forma rápida e sábia na sua tomada de decisão real.” intuitivamente A escolha da palavra “” é marcante aqui. Claude parece pensar que há mais do que apenas um algoritmo que escolhe a próxima palavra. O que alguns podem chamar de “sistema Claude” também representa a esperança de que os chatbots serão capazes de “alavancar cada vez mais a sua própria sabedoria e compreensão”.
sabedoria? Claro, muitas pessoas aceitam conselhos de grandes modelos de linguagem, mas outra coisa é professar que esses dispositivos algorítmicos realmente têm a seriedade associada a tais termos. Mesmo quando chamo por ele, Askel não dá um passo para trás. “Acho que Claude definitivamente tem alguma sabedoria”, ela me disse.

















