O Reddit está processando o desenvolvedor de pesquisa de IA Perplexity e as empresas das quais compra dados de treinamento de IA, alegando que as empresas de dados coletam conteúdo ilegalmente e violam as proteções de direitos autorais.

O conteúdo da ação é enviado O caso foi realizado na quarta-feira no Tribunal Distrital dos EUA para o Distrito Sul de Nova York. Além da Perplexity, três outras empresas de dados são citadas como rés: Oxylabs UAB, AWMProxy e SerpApi.

O Reddit disse em um documento que a empresa de dados usou tecnologia que ocultou sua identidade e localização para acessar quase 3 bilhões de páginas de resultados de mecanismos de pesquisa (SERPs) durante um período de duas semanas em julho, contornando as barreiras tecnológicas do Reddit e do Google. O Reddit os descreve como “ladrões de bancos que sabem que não podem entrar em cofres de bancos e, em vez disso, arrombar caminhões blindados que transportam dinheiro”.


Não perca nosso conteúdo técnico imparcial e análises baseadas em laboratório. Adicionar CNET Como fonte preferencial no Google.


O Reddit disse que emitiu anteriormente uma carta de cessação e desistência porque rastreou os dados coletados ilegalmente até o Perplexity. Segundo o relatório, a Perplexity ainda está listada como cliente da SerpApi, uma das empresas de dados. Sitejunto com Meta, Samsung e Nvidia.

Logotipo do AI Atlas

CNET

Reddit é uma das plataformas online mais populares. relatório Mais de 110 milhões de usuários ativos diariamente, mais de 22 bilhões de postagens e comentários. Isso o torna uma das fontes mais populares do tipo de dados gerados por humanos que as empresas de IA procuram. Reddit assinou o acordo com OpenAI e Google Licencie seus dados. Também está processando a Anthropic por uso indevido dos dados.

A Perplexity também foi recentemente processada por violação de direitos autorais. Enciclopédia Britânicapossui o Dicionário Merriam-Webster.

A Perplexity não respondeu imediatamente a um pedido de comentário.

Os direitos autorais são uma das questões jurídicas mais controversas para as empresas de IA. Treinar e melhorar modelos de IA requer grandes quantidades de conteúdo gerado por humanos, como postagens no Reddit. Grande parte desse conteúdo é protegido por direitos autorais e as empresas normalmente precisam negociar com os detentores dos direitos para licenciá-lo e usá-lo.

Algumas empresas de IA têm acordos de licenciamento multimilionários com editoras como Axel Springer, mas outras argumentam que a utilização de material protegido por direitos de autor é uma utilização justa e, portanto, não têm de pagar taxas. Uma série de ações judiciais contestam os detalhes na Justiça. meta e humano Ganhe uso justo neste verão. (Divulgação: a controladora da CNET, Ziff Davis, entrou com uma ação judicial contra a OpenAI em abril, alegando que ela infringia os direitos autorais de Ziff Davis no treinamento e operação de sistemas de IA.)

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui