As empresas Google e OpenAI, dona do ChatGPT, foram acusadas de usar vídeos do YouTube para treinar modelos de linguagem de inteligência artificial (IA). A informação foi revelada em uma reportagem publicada no The New York Times.
Segundo a matéria, as duas companhias utilizaram transcrições de vídeos do YouTube para alimentar a base de dados de IAs generativas como o Gemini e o próprio ChatGPT. O problema? Isso foi feito sem a devida autorização dos canais e representa uma possível violação dos termos de serviço da plataforma.
O motivo envolve as próprias regras do YouTube, que impede o uso dos clipes para treinamento de chatbots. Recentemente, o próprio CEO da plataforma de vídeos criticou o possível uso dos materiais pela Sora, a IA generativa de vídeos que tem impressionado a indústria pelas criações audiovisuais.
Usar vídeos do YouTube para treinar IAs é ilegal?
Usar vídeos do YouTube para alimentar IAs sem autorização do dono do canal é considerado ilegal pelos termos de serviço do YouTube. Essa é uma regra parecida com a de utilização de textos de livros ou artigos de jornais, por exemplo.
No caso da OpenAI, a companhia teria utilizado o modelo de linugagem Whisper de transformação de áudios em texto para fazer a transcrição de vídeos do YouTube. Esses materiais são então adicionados à biblioteca do GPT, incorporados à base de conhecimentos do serviço.
O ChatGPT pode ter transcrições irregulares de vídeos em sua base de dados.Fonte: GettyImages
Esse caso é tão polêmico quanto o uso de outros materiais da internet para treinar a IA, já que não envolve qualquer tipo de solicitação ou bonificação ao detentor dos direitos autorais do conteúdo. Além disso, o ChatGPT não costuma citar as fontes ou inspirações da geração de respostas, ou textos.
Até agora, a OpenAI não se manifestou sobre as acusações. Na entrevista já citada, o CEO do YouTube, Neal Mohan, disse desconhecer se o ChatGPT tem ou não vídeos entre os seus conteúdos absorvidos da internet.
O caso do Google é um pouco diferente, até pela empresa ser a dona do YouTube. De acordo com a reportagem, a companhia também utilizou transcrições de vídeos para aprimorar o Gemini, nome tanto do modelo de linguagem quanto do atual chatbot da marca.
Nesse caso, a companhia não negou as acusações. Porém, ela afirma que só fez isso em casos específicos, com a devida autorização dos donos de canais em uma parceria pré-estabelecida.