NOVA IORQUE – A plataforma de mídia social Reddit abriu um processo contra a startup de inteligência artificial Perplexity no tribunal federal de Nova York em 22 de outubro, acusando-a e três outras empresas de coletar dados ilegalmente para treinar o mecanismo de busca baseado em IA da Perplexity.
O Reddit disse em sua reclamação que as empresas de coleta de dados contornaram as medidas de proteção de dados para roubar dados “absolutamente necessários” para alimentar o sistema de “mecanismo de resposta” da Perplexity.
O processo é um dos muitos movidos por proprietários de conteúdo contra empresas de tecnologia por supostamente usarem indevidamente material protegido por direitos autorais para treinar sistemas de IA.
O Reddit abriu um processo semelhante contra a startup de IA Antrópico em junho, que ainda está pendente.
“À medida que utilizamos IA precisa para fornecer respostas baseadas em factos, a nossa abordagem permanece baseada em princípios e responsável, e não toleramos ameaças à abertura e ao interesse público”, disse a Perplexity num comunicado.
“As empresas de IA estão envolvidas numa corrida armamentista por conteúdo humano de qualidade, e essa pressão está alimentando uma economia de ‘lavagem de dados’ em escala industrial”, disse Ben Lee, diretor jurídico do Reddit, em comunicado.
O Reddit, que apresenta milhares de comunidades da web “subreddit” baseadas em interesses, é a fonte mais comumente citada de respostas geradas por IA às perguntas dos usuários, disse a reclamação.
A empresa licencia conteúdo para Google, OpenAI e outros para treinamento em IA.
O Reddit disse que a Oxylabs, com sede na Lituânia, a AWMProxy, com sede na Rússia, e a SerpApi, com sede no Texas, coletaram dados do Reddit de bilhões de resultados de pesquisa sem permissão, e a Perplexity, que não tem licença para usar o conteúdo do Reddit, trabalhou com pelo menos uma empresa de coleta de dados para obter materiais do Reddit.
Porta-vozes da Oxylabs e da SerpApi não responderam imediatamente aos pedidos de comentários sobre esta história.
Não foi possível contatar o AWMProxy para comentar.
O Reddit enviou à Perplexity uma carta de cessar e desistir em 2024, dizendo que desde então “aumentou a quantidade de citações ao Reddit em 40x”.
O Reddit pediu ao tribunal uma indenização monetária não especificada e uma ordem para impedir que a Perplexity usasse os dados. Reuters