O julgamento em tribunal entre ‘The New York Times’ e a OpenAI poderá mudar o uso de conteúdo protegido em IA

Na passada terça-feira, um juiz federal nos Estados Unidos presidiu às primeiras audiências do julgamento que coloca o The New York Times contra a OpenAI e a Microsoft. Este caso, que pode estabelecer precedentes na relação entre direitos de autor e inteligência artificial, examina se a utilização de conteúdo protegido para treinar modelos de linguagem de larga escala (LLM) constitui uma infração legal ou está protegido pelo direito de “uso legítimo” (fair use).

O argumento do The New York Times

Os advogados do jornal alegam que a OpenAI utilizou artigos completos e excertos do seu conteúdo para treinar os LLMs, como o ChatGPT. Em muitos casos, afirmam que os resultados gerados pelo modelo incluem texto idêntico ou resumos que não citam a fonte original, prejudicando diretamente a sua capacidade de atrair tráfego para o site.

A empresa também acusa a OpenAI de permitir que ferramentas como o SearchGPT contornem os paywalls do seu conteúdo, o que representa uma ameaça direta ao seu modelo de negócio baseado em subscrições. Além disso, foram apresentados exemplos de como o ChatGPT reproduziu recomendações de produtos publicadas pelo Wirecutter – o site de recomendações do The New York Times – sem atribuição adequada. Em alguns casos, produtos recomendados pelo Wirecutter foram citados de forma errada, o que poderia prejudicar a reputação da marca.

Segundo informações da Digiday, a equipa legal do The New York Times argumenta que estas ações não só representam uma infração de direitos de autor, como também violam as chamadas "notícias urgentes" (hot news), que protegem conteúdos sensíveis ao tempo, como promoções da Black Friday.

A defesa da OpenAI e da Microsoft

Por outro lado, os advogados da OpenAI e da Microsoft argumentaram que o uso do conteúdo do jornal está protegido pelo princípio de fair use, que permite a reutilização de material protegido desde que seja transformador, não comercial ou que não represente uma ameaça significativa para os titulares dos direitos.

A defesa insistiu que os LLMs não armazenam conteúdo textual, mas geram respostas com base em padrões de dados aprendidos durante o treino. Compararam esta capacidade com a forma como as pessoas se lembram de músicas ou frases populares sem as memorizarem literalmente.

Os advogados da OpenAI também destacaram que as acusações do The New York Times sobre prejuízos económicos carecem de provas sólidas. Segundo a defesa, não foi demonstrado como as práticas da OpenAI afetaram negativamente as receitas publicitárias ou de subscrição do jornal.

As implicações para a indústria

Este caso é apenas um dos muitos processos em curso relacionados com o uso de conteúdo protegido na inteligência artificial. A resolução poderá ter um impacto profundo no ecossistema digital, afetando não só os meios de comunicação, mas também as empresas tecnológicas e os desenvolvedores de IA.

Além disso, este caso surge num contexto de tensões crescentes entre empresas tecnológicas e titulares de direitos de autor. A Meta enfrenta uma ação coletiva movida por escritores como Sarah Silverman, enquanto a Google também está envolvida em litígios relacionados com direitos de autor apresentados pela Authors Guild.

O juiz Sidney Stein, que preside ao caso, ainda não decidiu se permitirá o avanço da ação. No entanto, especialistas jurídicos acreditam que o processo será prolongado, dada a sua complexidade e relevância para a indústria tecnológica e de media. “A decisão do tribunal poderá redefinir o desenvolvimento da inteligência artificial nos próximos anos”, afirmou Megan Gray, advogada especializada em direitos digitais.

Entretanto, o debate destaca um desafio maior: equilibrar a inovação tecnológica com a proteção dos direitos dos criadores, num ambiente em que a inteligência artificial está a transformar rapidamente a forma como o conteúdo é consumido.