Résumé
Spark est un moteur de traitement de données rapide dédié au big data. Très en vogue depuis quelques années il permet de traiter de gros volumes de données de manière distribuée. Grâce à sa vitesse, à sa simplicité d'usage et à la variété de ses bibliothèques d'algorithmes, il est de plus en plus utilisé pour les applications de machine learning.
Ce manuel de prise en main présente quatre des cinq modules de Spark. L'auteur a fait le choix du langage Python qui convient mieux aux débutants.
Son objectif est de permettre au lecteur d'installer et d'utiliser Spark de manière autonome, de comprendre les concepts du machine learning et d'en maîtriser les bonnes pratiques.
L'ouvrage est complété par de nombreux compléments en ligne accessibles sur GitHub.
Auteur
-
Fondateur du cabinet de conseil en data stratégie Mémorandum. Il accompagne les entreprises de toute taille dans leur réflexion stratégique sur l’utilisation de la data. C’est un spécialiste de la valorisation des données.
Il est l'auteur du livre SPARK; valorisez vos données en temps réel avec Spark ML et Hadoop, et co-auteur de la Boîte à outils de la stratégie Big Data (Dunod)
Caractéristiques
Publication : 8 janvier 2020
Support(s) : Livre numérique eBook [ePub]
Protection(s) : DRM (ePub)
Taille(s) : 16,1 Mo (ePub)
EAN13 Livre numérique eBook [ePub] : 9782100810161
EAN13 (papier) : 9782100794324