introduction Le livre commence par le stockage de donn?es de masse et le traitement des donn?es. Les syst?mes de stockage de donn?es et les m?thodes avanc?es de stockage en grappe sont pr?sent?s. Les donn?es structur?es et non structur?es, les probl?mes de compatibilit?, la qualit? des donn?es, la s?curit? des donn?es et le traitement en grappe sont examin?s. L'analyse du big data, ses ?tapes, ses capacit?s, ses sources de donn?es et ses cas d'utilisation sont ?galement d?velopp?s. La question du Big Data dans le nuage par le biais des services en nuage est ?galement abord?e. L'informatique distribu?e, son fonctionnement, ses mod?les, ses avantages, ses inconv?nients et ses utilisations sont ensuite abord?s. En outre, le calcul parall?le est abord? avec son ?volution, ses types, ses avantages, ses inconv?nients, ses mod?les de conception, ses architectures de m?moire, la synchronisation, les langages, les mod?les et les utilisations. Des exemples de calcul parall?le et distribu? sont pr?sent?s ? l'aide de l'outil de calcul parall?le de MATLAB et d'Apache Spark. Les syst?mes de stockage distribu?s sont ?galement d?velopp?s et les syst?mes de gestion de bases de donn?es distribu?es sont analys?s, en pr?sentant des exemples avec SQL Server. La haute disponibilit?, la tol?rance aux pannes et leur mise en oeuvre sur le web et dans le nuage sont ?galement abord?es. Il aborde ?galement les outils de calcul massif dans les ?cosyst?mes Big Data en mettant l'accent sur Hadoop, Mapreduce, Hadoop Distribute File System et les composants communs d'Hadoop (Pig, Hive, Flume, Oozie, Hbase, Sqoop, Mahout et autres). Elle est suivie de l'automatisation des t?ches et d'exemples d?velopp?s avec SQL Server. L'?cosyst?me Hadoop d'Apache Ambari est ?galement pr?sent?. Les techniques d'analyse (essentiellement Data Mining et Business Intelligence) et le Big Data vont de pair pour une exploitation optimale de l'information. La qualit? et l'int?grit? des donn?es dans les processus de Big Data et le mouvement des donn?es entre les clusters sont ensuite abord?s. A titre d'exemple, la copie et le d?placement de bases de donn?es entre serveurs dans SQL Server sont d?velopp?s. Elle se termine par l'importation et l'int?gration des donn?es.
ThriftBooks sells millions of used books at the lowest everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15. ThriftBooks.com. Read more. Spend less.