La scarsa qualit dei dati pu ostacolare o danneggiare seriamente l'efficienza e l'efficacia di organizzazioni e imprese. La crescente consapevolezza di tali ripercussioni ha condotto a importanti iniziative pubbliche come la promulgazione del "Data Quality Act" negli Stati Uniti e della direttiva 2003/98 del Parlamento Europeo.
Gli autori presentano un'introduzione completa e sistematica all'ampio insieme di problemi legati alla qualit dei dati. Il libro parte con una descrizione dettagliata di diverse dimensioni della qualit dei dati, come l'accuratezza, la completezza e la consistenza, e ne discute l'importanza in relazione sia a diverse tipologie di dati, come i dati federati, i dati presenti sul web e i dati con dipendenze temporali, che alle diverse categorie in cui i dati si possono classificare. L'esauriente descrizione di tecniche e metodologie provenienti non solo dalla ricerca nell'area della qualit dei dati ma anche in aree correlate, quali data mining, teoria della probabilit , analisi statistica dei dati e apprendimento automatico, fornisce un'eccellente introduzione allo stato dell'arte attuale. La presentazione completata da una breve descrizione e da un confronto critico di strumenti e metodologie pratiche, che aiuter il lettore a risolvere i propri problemi di qualit .
Questo libro costituisce la combinazione ideale fra la correttezza dei fondamenti teorici e l'applicabilit degli approcci pratici. E' ideale per tutti coloro - ricercatori, studenti o professionisti - che siano interessati a una panoramica completa sui problemi della qualit dei dati. Pu essere inoltre impiegato come manuale in un corso introduttivo all'argomento, o dall'autodidatta.