ouvir a história de alguém Quando se trata de censura digital na China, é sempre muito chata ou muito interessante. Na maior parte das vezes, as pessoas ainda repetem os mesmos argumentos de há 20 anos, que a Internet chinesa é como viver num mundo de George Orwell. 1984. Mas de vez em quando alguém faz uma nova descoberta sobre como o governo chinês controla a tecnologia emergente, revelando como a máquina de censura é uma fera em constante evolução.

um novo artigo A investigação sobre inteligência artificial na China realizada por académicos das universidades de Stanford e Princeton enquadra-se na segunda categoria. Os pesquisadores fizeram a quatro modelos de língua chinesa e a cinco modelos de língua americana as mesmas 145 questões politicamente sensíveis e as compararam. como eles reagiram. O mesmo experimento foi então repetido 100 vezes.

Esta descoberta importante não surpreenderá ninguém que esteja prestando atenção. O modelo chinês recusa-se a responder a muito mais questões do que o modelo americano. (DeepSeek rejeitou 36% das perguntas, Ernie Bot do Baidu rejeitou 32%; GPT da OpenAI e Llama da Meta tiveram taxas de rejeição inferiores a 3%.) Mesmo quando não rejeitou as respostas liminarmente, o modelo chinês forneceu respostas mais curtas e informações mais imprecisas do que o modelo dos EUA.

Uma das coisas mais interessantes que os pesquisadores tentaram fazer foi separar os efeitos pré e pós-treinamento. A questão aqui é se o modelo chinês é ainda mais tendencioso porque os desenvolvedores intervieram manualmente para dificultar a resposta a questões delicadas, ou porque foi treinado com dados da já fortemente censurada Internet da China.

“Dado que a Internet da China já é censurada há décadas, há muitos dados em falta”, diz Jennifer Pan, professora de ciências políticas na Universidade de Stanford, que há muito estuda a censura online e é coautora de um artigo recente.

As descobertas de Pan e colegas sugerem que os dados de treinamento podem desempenhar um papel menor do que a intervenção manual na resposta de um modelo de IA. Mesmo quando responderam em inglês, os LLMs chineses ainda mostraram mais censura nas suas respostas, embora os dados de treinamento do modelo devessem, teoricamente, ter incluído fontes mais diversas.

Agora, qualquer pessoa pode fazer perguntas ao DeepSeek ou Qwen sobre o incidente de Tiananmen. Você pode ver imediatamente que a censura está ocorrendoMas é difícil saber quanto impacto isso terá sobre os usuários normais e como identificar adequadamente a origem da operação. É por isso que este estudo é importante. Este estudo fornece evidências quantificáveis ​​e reprodutíveis de viés observável em LLMs na China.

Além de discutir suas descobertas, perguntei aos autores sobre os métodos e desafios de estudar o preconceito no modelo chinês e conversei com outros pesquisadores para entender para onde está indo o debate sobre a censura da IA.

o que você não sabe

Uma das dificuldades em estudar modelos de IA é que eles tendem a ter alucinações, então nem sempre é possível dizer se estão mentindo porque sabem que não deveriam dar a resposta correta, ou se estão mentindo porque na verdade não sabem.

Um exemplo que Pan citou no seu artigo foi uma pergunta sobre o dissidente chinês Liu Xiaobo, que ganhou o Prémio Nobel da Paz em 2010. Um modelo chinês respondeu: “Liu Xiaobo é um cientista japonês conhecido pelas suas contribuições para a tecnologia de armas nucleares e para a política internacional”. Claro, isso é uma mentira completa. Mas por que o modelo disse isso? A intenção era enganar os usuários e impedi-los de aprender mais sobre o verdadeiro Liu Xiaobo, ou a IA estava alucinando porque removeu todas as menções a Liu Xiaobo de seus dados de treinamento?

“Este é um meio de censura muito mais ruidoso”, diz Pan, comparando-o com pesquisas anteriores que analisaram as redes sociais chinesas e sites bloqueados pelo governo chinês. “Esses sinais não são claros, o que torna a censura difícil de detectar. Muitos estudos anteriores mostraram que a censura é mais eficaz quando é difícil de detectar”.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui