Amazon cover image
Image from Amazon.com

Apache Spark : développez en Python pour le big data / [Nastasia Saby]

LivresAuteur principal: Saby, Nastasia, AuteurLangue: français.Éditeur : St-Herblain : Éditions ENI • C 2022Description : 1 volume (308 p.) : ill. en noir, couv. ill. en coul. ; 22 cmISBN: 978-2-409-03378-0.Collection : Expert IT, 1958-9913A pour autre édition sur un support différent : Apache Spark, développez en Python pour le big data, Nastasia Saby, 2022, St-Herblain, Editions ENI, Expert IT, 978-2-409-03379-7Résumé :
Présentation des fondements et de l'ensemble des fonctionnalités de ce framework open source de calcul distribué. Architecture logicielle, composants, langages, transformation de données, fenêtrages, apprentissage machine sont passés en revue. Avec des exemples de mise en pratique, des exemples de code et une partie consacrée à l'industrialisation de Spark. Version en ligne gratuite. ­ [Electre 2022]"Ce livre sur le framework Apache Spark vous permet d'apprendre à développer des applications en Python en vous appuyant sur l'analyse et le traitement de données volumineuses ainsi que sur la notion d'apprentissage automatique.Après quelques définitions de termes liés au domaine de la data, vous découvrez les fondements de Spark. Vous appréhendez l'architecture logicielle du framework, ses composants et les différents langages avec lesquels il est possible de développer.Vous entrez ensuite concrètement dans la transformation de données. Fonctions numériques, alphanumériques, ajouts d'information, suppressions, agrégations de premier ordre et plus complexes sont à l'honneur. Des fonctionnalités plus avancées telles que les fonctions de fenêtrage et celles définies par les utilisateurs sont étudiées et les nombreuses API de Spark parcourues, tout en étant illustrées par des exemples.Dans la suite du livre, l'auteur dévoile l'apprentissage machine. Apprentissage supervisé, non supervisé, profond et moteurs de recommandation sont autant de concepts détaillés. Vous découvrez les différents algorithmes présents dans Spark, les manières de préparer des données à l'entraînement ainsi que les possibilités d'évaluation d'un système prédictif au travers de plusieurs mises en pratique. Les notions d'arbres de décision, de forêts aléatoires, de réseaux de neurones, de régressions linéaires et de factorisation de matrices vous sont expliquées ainsi que le traitement des informations numériques et la vectorisation de textes.Pour finir, un chapitre met en avant l'industrialisation de Spark. Déployer, déboguer et tester son application ainsi que les subtilités de l'outil pour assurer une performance optimale sont autant d'éléments cruciaux détaillés.Si les exemples de code du livre sont en Python, langage aujourd'hui le plus utilisé avec Spark, certains sont en Scala, API la plus aboutie, pour vous apporter une vision complète du framework." [4è de couv]
Sujet - Nom commun: Apache Spark (langage de programmation) | Python (langage de programmation) | Données massives | Apprentissage automatique Sujet - Forme: Guides pratiques Voir dans le SUDOC
Holdings
Item type Current library Collection Shelving location Call number Status Date due Barcode Item holds
Prêt normal Enssib Papier Pôle Information numérique et médias 003 LOG apa (Browse shelf(Opens below)) Available 9200241
Total holds: 0

La couv. porte en plus : "Informatique technique", "en téléchargement : code source des exemples", "+ quiz, version en ligne offerte! pendant 1 an"

Index

Présentation des fondements et de l'ensemble des fonctionnalités de ce framework open source de calcul distribué. Architecture logicielle, composants, langages, transformation de données, fenêtrages, apprentissage machine sont passés en revue. Avec des exemples de mise en pratique, des exemples de code et une partie consacrée à l'industrialisation de Spark. Version en ligne gratuite. ­ Electre 2022

"Ce livre sur le framework Apache Spark vous permet d'apprendre à développer des applications en Python en vous appuyant sur l'analyse et le traitement de données volumineuses ainsi que sur la notion d'apprentissage automatique.Après quelques définitions de termes liés au domaine de la data, vous découvrez les fondements de Spark. Vous appréhendez l'architecture logicielle du framework, ses composants et les différents langages avec lesquels il est possible de développer.Vous entrez ensuite concrètement dans la transformation de données. Fonctions numériques, alphanumériques, ajouts d'information, suppressions, agrégations de premier ordre et plus complexes sont à l'honneur. Des fonctionnalités plus avancées telles que les fonctions de fenêtrage et celles définies par les utilisateurs sont étudiées et les nombreuses API de Spark parcourues, tout en étant illustrées par des exemples.Dans la suite du livre, l'auteur dévoile l'apprentissage machine. Apprentissage supervisé, non supervisé, profond et moteurs de recommandation sont autant de concepts détaillés. Vous découvrez les différents algorithmes présents dans Spark, les manières de préparer des données à l'entraînement ainsi que les possibilités d'évaluation d'un système prédictif au travers de plusieurs mises en pratique. Les notions d'arbres de décision, de forêts aléatoires, de réseaux de neurones, de régressions linéaires et de factorisation de matrices vous sont expliquées ainsi que le traitement des informations numériques et la vectorisation de textes.Pour finir, un chapitre met en avant l'industrialisation de Spark. Déployer, déboguer et tester son application ainsi que les subtilités de l'outil pour assurer une performance optimale sont autant d'éléments cruciaux détaillés.Si les exemples de code du livre sont en Python, langage aujourd'hui le plus utilisé avec Spark, certains sont en Scala, API la plus aboutie, pour vous apporter une vision complète du framework." 4è de couv

There are no comments on this title.

to post a comment.

Koha version 24.05

L'Enssib est membre associée de l'Université de Lyon