A IA pode ficar sem dados de treinamento em 4 anos; saiba mais


Uma projeção do Epoch AI, um instituto de pesquisa virtual, indica que as inteligências artificiais (IAs) podem enfrentar uma escassez de dados para treinamento em 2029. De acordo com os cientistas, o volume necessário de dados para treinar uma IA pode alcançar o mesmo nível do texto público disponível online, limitando assim a capacitação de novos modelos e a evolução de modelos mais complexos.

Além disso, a restrição imposta pelos veículos de mídia — como jornais e sites de notícias — sobre o uso de seu conteúdo está se intensificando. Essa situação impede que materiais gerados por esses veículos sejam utilizados para alimentar e treinar IAs. Um artigo publicado na revista Nature na quarta-feira (11) discute essa problemática e revela que as principais empresas do setor já estão buscando soluções para o iminente esgotamento de dados.

Conforme apurado por Nicola Jones, uma alternativa pode ser a combinação de dados de bancos privados com textos públicos. O uso de mensagens trocadas no WhatsApp e transcrições de vídeos do YouTube, que têm acesso garantido às empresas responsáveis, também surge como uma possibilidade viável. Outra solução pode envolver conjuntos de dados mais restritos que estão em constante expansão, como os dados astronômicos.

Por fim, a criação de dados artificialmente é considerada uma terceira opção, embora isso apresente um desafio em termos de precisão. “O problema com dados sintéticos é que loops recursivos podem consolidar falsidades, ampliar conceitos errôneos e, em geral, degradar a qualidade do aprendizado”, afirma Jones, referindo-se a um estudo de 2023.

Este conteúdo foi originalmente publicado em IA pode ficar sem dados de treinamento em 4 anos; entenda no site CNN Brasil.



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *