InícioTecnologiaA Wikipédia encontrou uma maneira de lidar com a grande quantidade de...

A Wikipédia encontrou uma maneira de lidar com a grande quantidade de bots de treinamento de inteligência artificial que estão sobrecarregando seus servidores.

Você não está sozinho ao recorrer à Wikipédia em busca de informações rápidas. Recentemente, um grande volume de bots de inteligência artificial sendo treinados em artigos da Wikipédia tem sobrecarregado severamente os servidores da organização.

Para evitar a entrada de “tráfego não humano” que coleta dados do site para treinamento, a Wikipedia está adotando uma estratégia proativa: disponibilizando seus dados diretamente aos desenvolvedores de inteligência artificial.

Na quarta-feira, a Fundação Wikimedia revelou que estabeleceu uma colaboração com a empresa Kaggle, de propriedade da Google, para lançar um conjunto de dados beta contendo conteúdo estruturado da Wikipédia em inglês e francês. Disponibilizado em 15 de abril, este conjunto de dados facilita o acesso a informações de artigos prontas para uso, que podem ser utilizadas imediatamente para modelagem, benchmarking, alinhamento, ajuste fino e análise exploratória.

Segundo informações da Ars Technica, bots que acessam a Wikipédia e as páginas da Wikimedia Commons utilizaram metade da largura de banda disponível, causando uma grande sobrecarga nos sistemas da organização sem fins lucrativos. A Wikimedia espera que fornecer dados aos desenvolvedores desencoraje a utilização excessiva de bots em suas páginas.

A ascensão da inteligência artificial generativa resultou em uma proliferação de bots indesejados que buscam avidamente mais dados pela internet. Para se destacarem da concorrência, as empresas de IA demonstram um apetite insaciável por informações, incluindo obras protegidas por direitos autorais. Essa prática tem sido objeto de controvérsia, com artistas, autores e músicos argumentando nos tribunais que o uso dessas obras para treinamento viola a legislação de direitos autorais quando realizado sem crédito, compensação ou consentimento.

Por isso, empresas como Meta e OpenAI enfrentam disputas legais por supostas violações de direitos autorais, com o Authors Guild e The New York Times alegando que essa conduta não está amparada pela doutrina do uso justo.

LEIA:  A startup apoiada por Sam Altman está desenvolvendo um scanner óptico que pode identificar pessoas através da inteligência artificial.

No entanto, a distinção reside no fato de que todo o material da Wikipédia é licenciado sob a licença Creative Commons Attribution-ShareAlike, o que permite o uso livre do conteúdo, desde que seja atribuído corretamente e distribuído sob a mesma licença. A Fundação Wikimedia informou ao Gizmodo que a Kaggle adquiriu os dados por meio da Wikimedia Enterprise, e as empresas de IA devem respeitar os termos de atribuição e licenciamento da Wikipédia.

A colaboração entre a Wikimedia e a Kaggle abre uma nova possibilidade, possibilitando que as empresas de Inteligência Artificial treinem seus modelos com dados da internet que foram adquiridos de forma legal e, pelo menos em parte, ética.

Inteligência Artificial

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui

Trends