Este artigo foi publicado pela primeira vez Conversa,

tendo em vista O trágico tiroteio em Bondi Beach na semana passadaTeorias da conspiração e desinformação deliberada se espalharam nas redes sociais.

Uma coisa que algumas pessoas perceberam é que os dados do Google Trends mostram um aumento nas pesquisas por “Naveed Akram” – Nome do suposto agressor sobrevivente – De Tel Aviv (ou outros locais) antes do tiroteio. Num surpreendente salto lateral, é levado a mostrar que Akram deve ser um agente israelita.

Conheça novidades do app 7NEWS: Baixe hoje Seta

Histórias semelhantes circularam quando ativistas de direita americanos foram Charlie Kirk foi assassinado em setembroe depois de um Membros da Guarda Nacional dos EUA atacados em novembro.

Então, o que está acontecendo aqui? O Google disse à ABC que o Google Trends às vezes pode mostrar pesquisas mesmo quando nada realmente aconteceu devido ao “ruído estatístico”.

Estudei extensivamente a mecânica do Google Trends em minha pesquisa e posso confirmar que isso é verdade – e o “ruído” pode levar a resultados estranhos, especialmente quando se olha para pesquisas por termos incomuns ou vindos de áreas pequenas.

Como funciona o Google Trends?

O Google Trends mostra informações sobre o que os usuários estão pesquisando em diferentes locais e horários. Os dados que utiliza são o que os estatísticos chamam de “séries temporais”, mas são incomuns em alguns aspectos.

Em primeiro lugar, você pode selecionar facilmente diferentes escalas de tempo, como minuto a minuto e ano a ano.

O segundo fato é que os dados são apenas uma pequena amostra do volume verdadeiramente vasto de pesquisas no Google. As séries temporais normalmente incluem todos os dados disponíveis (como dados de hospitalização anual).

A página de ajuda do Google Trends explica desta forma:

Embora o Google Trends use apenas uma amostra de pesquisas do Google, é substancial, considerando que lidamos com bilhões de pesquisas todos os dias.

Ruído estatístico e pesquisas raras

No entanto, minha pesquisa mostrou que consultas relacionadas a termos que não são amplamente pesquisados ​​(como “navid akram”) Primeiro fotografia) ou em pequenas áreas geográficas (onde há menos pessoas pesquisando) podem mostrar uma grande variedade de resultados de uma amostra para outra.

Muitas publicações enganosas nas redes sociais mostram resultados de tendências de uma pequena área (como apenas a cidade de Tel Aviv), o que exagera a variação. A alta variação causa um padrão muito distinto de valores zero ou próximos de zero com alguns grandes picos isolados, o que fica bem evidente no post abaixo.

Os usuários que interpretam mal os dados estão promovendo informações falsas sobre o ataque terrorista de BondiOs usuários que interpretam mal os dados estão promovendo informações falsas sobre o ataque terrorista de Bondi
Os usuários que interpretam mal os dados estão promovendo informações falsas sobre o ataque terrorista de Bondi Crédito: Conversa

Esses picos são frequentemente causados ​​por “ruído estatístico” nos dados – pequenas flutuações aleatórias que suavizam quando um grande número de eventos é observado. Você pode ver isso claramente quando compara com pesquisas de alto volume.

Como os resultados do Google Trends mudam ao longo do tempo

Outro equívoco sobre dados está relacionado ao tempo. Algumas postagens mencionaram como os resultados exibidos parecem mudar de uma visualização para outra. Na verdade, é isso que se pode esperar dos dados do Google Trends.

Esta é uma combinação da escala de tempo utilizada e do fato de o Google usar apenas uma amostra dos dados completos. Para obter resultados precisos, é necessário coletar várias amostras de dados do Google Trends.

No entanto, isto apresenta um novo desafio. Para dados de curto prazo (como aqueles comumente usados ​​nessas postagens nas redes sociais), o Google atualiza constantemente os resultados em tempo real. Para dados de longo prazo, o Google adiciona apenas uma nova amostra por dia (embora tenhamos desenvolvido maneiras de evitar isso).

O que realmente significam os números do Google Trends?

O terceiro equívoco é que os números mostrados no gráfico do Google Trends são o número de pesquisas para um determinado termo. No entanto, a ajuda do Google Trends afirma novamente que os valores são “normalizados por hora e local” e depois “escalados em um intervalo de 0 a 100”.

Isso significa que o ponto no tempo na série com mais pesquisas é definido como 100 e todos os outros pontos são dimensionados em relação a esse ponto. Portanto, se o número máximo de pesquisas fosse 10, apareceria 100 – e se houvesse três pesquisas em qualquer outro momento, apareceria 30 (embora o Google suprima pesquisas de volume muito baixo).

Os dados do Google Trends não são uma forma precisa de provar informações verdadeirasOs dados do Google Trends não são uma forma precisa de provar informações verdadeiras
Os dados do Google Trends não são uma forma precisa de provar informações verdadeiras Crédito: Conversa

De certa forma, o número em cada ponto no tempo representa a probabilidade de que uma pesquisa contendo termos especificados ocorra naquele local e naquele momento.

Portanto, uma postagem sobre a tendência na busca pelo suposto assassino de Charlie Kirk, alegando que “as chances de isso acontecer são inferiores a 1 em 1 bilhão”, está incorreta.

Na verdade, é altamente provável: se “Tyler James Robinson” (suposto assassino de Charlie Kirk) tivesse 30 buscas, e “Lance Twiggs” (cúmplice de Robinson) tivesse 40, veríamos exatamente o mesmo padrão (se 40 for ampliado para 100; 30 for ampliado para 75 respectivamente).

poder do bom senso

Mesmo sem entender todas essas informações sobre os dados do Google Trends, um pouco de bom senso pode ajudar. Por exemplo, existem muitas pessoas chamadas Naveed Akram, incluindo um jogador de futebol paquistanês chamado Muhammad Naveed Akram.

Portanto, não é surpreendente que tenha havido algumas pesquisas por “Naveed Akram” mesmo antes de 14 de dezembro. (O Google Trends retorna qualquer pesquisa que contenha a consulta, então “Naveed Akram” também retornará “Muhammad Naveed Akram”.)

Os dados do Google Trends podem ser extremamente úteis para compreender eventos em tempo real. Por exemplo, tem sido utilizado para prever os resultados de eleições e referendos – com pouca margem de erro.

Porém, para fazer isso de maneira adequada, e não perpetuar a imaginação, é preciso compreender os dados e interpretar os resultados de maneira adequada. E o Google Trends certamente não nos diz nada sobre Navid Akram e o ataque terrorista de Bondi.

Jacques Raubenheimer é pesquisador sênior em bioestatística na Universidade de Sydney

Source link