100° Nexa Lunch Seminar. Produzione etica dei dataset per l’intelligenza artificiale: il ruolo della documentazione
Date:
100° Nexa Lunch Seminar.
La ricerca e lo sviluppo industriale dell'intelligenza artificiale hanno fatto passi da gigante negli ultimi anni, rendendo le tecnologie basate su di essa sempre più pervasive all'interno della società (anche in settori molto delicati come welfare, giustizia, credito, etc) e contribuendo ad automatizzare processi e decisioni. Uno degli elementi chiave alla base dell'IA sono i dati, i quali spesso determinano la qualità dei risultati ottenuti.
Per questo è sempre più importante far sì che i professionisti dell'IA siano pienamente consapevoli delle caratteristiche dei dati e dei processi che li hanno generati, comprese le scelte progettuali più o meno implicite e basate su presupposti tutt'altro che neutri. La documentazione dei dataset può rappresentare uno strumento molto utile in questa prospettiva. Essa rappresenta la principale forma di comunicazione tra produttori e utilizzatori dei dataset, in grado di rendere trasparente il contesto attorno il quale i dati sono stati raccolti, annotati e trasformati.
In questa ricerca è stato individuato un insieme di informazioni rilevanti che dovrebbero sempre essere allegate ad un dataset per garantirne un utilizzo consapevole. In secondo luogo, sono state analizzate le documentazioni dei 100 dataset più popolari tra alcune delle principali piattaforme del settore al fine di valutarne la completezza. Quello che emerge è la necessità di una maggiore attenzione al processo di documentazione, anche per garantire risultati più equi.