Wikipedia vuole dissuadere gli sviluppatori di intelligenza artificiale dallo scraping della piattaforma, cioé le tecniche automatizzate per estrarre grandi quantità di dati da pagine web, rilasciando un dataset ottimizzato per l'addestramento di modelli di intelligenza artificiale.
Secondo Wikimedia, le "rappresentazioni JSON ben strutturate dei contenuti di Wikipedia" disponibili per gli utenti di Kaggle dovrebbero essere un'alternativa più attraente allo scraping o parsing del testo grezzo degli articoli, un problema che sta attualmente mettendo sotto sforzo i server di Wikipedia mentre bot AI automatizzati consumano incessantemente la larghezza di banda della piattaforma.