Al momento si sta ‘addestrando’ sulle citazioni di Wikipedia.
Il team di ricerca di Sphere – spiega il sito specializzato TechCrunch – attualmente si basa su 134 milioni di pagine web pubbliche. Wikipedia lo sta sperimentando per scansionare automaticamente le sue voci e identificare quando le citazioni sono fortemente o debolmente supportate. L
‘idea alla base dell’utilizzo di Sphere per l’enciclopedia è semplice: la piattaforma online ha 6,5 ;;milioni di voci, ogni mese sono aggiunti in media circa 17.000 articoli in crowdsourcing, una mole enorme di materiale che non è semplice da verificare per il team di editori incaricato di supervisionarlo. Meta – spiega TechCrunch – non ha accordi finanziari con Wikipedia e per addestrare il modello Sphere, ha creato “un nuovo set di dati di 4 milioni di citazioni di Wikipedia, il più complesso mai utilizzato per questo tipo di ricerca”. “Il nostro obiettivo è creare una piattaforma per aiutare gli editori di Wikipedia a individuare sistematicamente i problemi di citazione e correggere rapidamente il contenuto dell’articolo”, spiega Meta.
Essendo Sphere uno strumento aperto, open source, può costituire una base per i modelli di formazione di Intelligenza artificiale. “Il nostro prossimo passo è formare modelli per valutare la qualità dei documenti recuperati, rilevare potenziali contraddizioni, dare priorità a fonti più affidabili”, ha osservato Meta che al momento non sta usando questo modello per le sue piattaforme come Facebook, Instagram e Messenger che in passato sono state al centro di polemiche proprio per la diffusione di fake news e contenuti inesatti.