Nesta última sexta-feira (8), a multinacional de tecnologia, Nvidia, foi processada por violação de direitos autorais por três autores norte-americanos, cujas obras foram utilizadas sem permissão para treinar a framework de inteligência artificial NeMo, que suporta a performance de modelos como o GPT-3 e Stable Diffusion.
De acordo com a ação judicial, os seus livros teriam sido utilizados em uma base de dados utilizada para o treinamento da IA – esta base contendo um total de 196.640 livros – de forma que o algoritmo aprendesse a emular a escrita humana. Três autores já haviam reclamado do uso sem permissão de suas obras, e em outubro do ano passado, a empresa retirou do ar esse conjunto de dados “devido a denúncia de violação de direitos autorais”.
Com isso, foi possível argumentar que a empresa de tecnologia teria utilizado conscientemente de material com direitos autorais, e sem permissão, durante os últimos três anos. É o que ocorreu na última semana no tribunal federal de São Francisco, com um processo que traz à tona questões éticas sobre o modo de desenvolvimento das inteligências artificiais.
Autores
Os autores que iniciaram o processo contra a Nvidia são:
- Brian Keene, autor de Ghost Walk (2008);
- Abdi Nazemian, autor de Like a Love Story (2019);
- Stewart O’Nan, autor de Last Night at the Lobster (2007).
No entanto, alegadamente não são os únicos a terem suas obras utilizadas para ‘alimentar’ as inteligências artificiais sem permissão, e o resulto do processo judicial poderia, argumentam, ajudar a trazer justiça para outros que também tiveram seu trabalho explorado sem permissão durante o desenvolvimento da IA NeMo.
Ética da IA
A Nvidia ainda não chegou a comentar sobre o caso, e os advogados dos autores não divulgaram mais informações. É uma situação que reflete os processos já ocorridos contra a OpenAI e a Microsoft, por conta de violações similares encontradas no ChatGPT.
O principal ponto de controvérsia fica claro ao notar alguns pontos essenciais. Em primeiro lugar, a IA depende de uma base de dados para dar início ao seu aprendizado, e emular um trabalho necessariamente alheio.
Em segundo lugar, após o algoritmo aprender a escrever de forma coerente, é possível às vezes notar um certo ‘plágio suave’, com a cópia de estilos usados na base de dados, uma consequência natural do processo de treinamento.
Em terceiro lugar, o programa pode então ser vendido por uso (com tokens pagos), gerando um lucro que utilizou o trabalho do artista, mas que nunca o recompensa.
Construção e lucros
A construção de uma inteligência artificial naturalmente é uma mistura de toda a base de dados utilizada, mas frequentemente é tratada como uma entidade por si só, sem atribuir o devido crédito aos que providenciaram os dados. Por conta do boom da IA, nota-se que a Nvidia tem aumentado muito os lucros, chegando com a valorização da empresa até a casa dos US$ 2 trilhões, perto de passar a Apple.