Provas judiciais revelam que a Meta utilizou materiais protegidos por direitos de autor sem licença para treinar a sua IA
Num dos casos judiciais mais relevantes sobre propriedade intelectual e inteligência artificial, a Meta foi alvo de graves acusações após perder esta “batalha legal”. Um tribunal da Califórnia desclassificou recentemente informações importantes que implicam a gigante tecnológica no uso de dados piratas para treinar os seus modelos de IA.
Segundo novos relatórios, a Meta utilizou a base de dados LibGen (Library Genesis), uma conhecida biblioteca pirata que aloja milhares de livros protegidos por direitos de autor, para alimentar a sua IA generativa — o que levou à apresentação de queixas por parte dos autores afetados.
Este caso, conhecido como Kadrey et al. v. Meta Platforms, teve início em 2023, quando os romancistas Richard Kadrey e Christopher Golden, juntamente com a comediante Sarah Silverman, processaram a Meta por utilizar as suas obras sem autorização para treinar os seus modelos de IA. Ao longo do processo, a Meta defendeu a sua conduta com o argumento de que o uso de dados públicos para treinar ferramentas de IA está protegido pela doutrina do “uso legítimo”, o que, na sua opinião, o torna legal. No entanto, os documentos recentemente desclassificados revelam que a Meta tinha plena consciência de que estava a utilizar material pirateado, o que coloca em causa os seus argumentos legais e éticos.
De acordo com a Wired, o juiz Vince Chhabria, responsável pela supervisão do caso no Tribunal Distrital dos Estados Unidos para o Distrito Norte da Califórnia, concluiu que a Meta não pretendia proteger os seus interesses comerciais com os pedidos de censura, mas sim evitar má publicidade. Entre os documentos agora públicos, consta um comentário interno de um funcionário da Meta que expressa preocupação de que, caso fosse descoberto que a empresa tinha utilizado a LibGen, perderia uma vantagem importante nas negociações com os reguladores. Apesar destes avisos internos, a Meta avançou com a utilização da base de dados.
Para além das implicações legais associadas ao uso da LibGen, a empresa está a ser acusada de distribuir material pirata. Os documentos revelam que a Meta não só descarregou, como também carregou ficheiros de livros pirateados em websites de torrents, o que agravaria ainda mais a sua responsabilidade jurídica. Este tipo de atividade coloca a Meta numa situação particularmente delicada, já que não só estaria a usar material protegido sem autorização, como também a participar ativamente na sua distribuição.
A LibGen, que teve início na Rússia em 2008, tem sido alvo de inúmeros processos judiciais ao longo dos anos. Em 2024, um juiz de Nova Iorque ordenou que a LibGen pagasse 30 milhões de dólares por violação de direitos de autor, embora a identidade dos administradores da base de dados continue desconhecida.
Este caso tem implicações mais amplas para a indústria tecnológica, pois poderá determinar de que forma serão reguladas as práticas de treino de IA com dados protegidos por direitos de autor. Se o tribunal decidir contra a Meta, poderá estabelecer um precedente que afetará outras empresas tecnológicas que dependem de grandes volumes de dados para treinar os seus modelos de IA. As consequências poderão ser significativas, obrigando estas empresas a procurar métodos mais dispendiosos e eticamente responsáveis para obter os dados necessários ao treino das suas ferramentas de IA.
A Meta, que até agora tentou manter em segredo a utilização da LibGen, ainda tem a possibilidade de recorrer da decisão. No entanto, a revelação destes documentos sugere que a empresa poderá enfrentar mais dificuldades legais num futuro próximo, o que poderá alterar a forma como se gerem as relações entre a indústria tecnológica e os detentores de direitos de autor.
Este escândalo sublinha as crescentes tensões entre a inovação tecnológica e a proteção dos direitos de autor — um tema central na regulação da inteligência artificial e da economia digital.