Le langage R au quotidien
Traitement et analyse de données volumineuses. Mise en pratique avec exemples en Open Data
Le langage R est un langage open source de traitement des données et d'analyse statistique. L'objectif de cet ouvrage est d'apprendre le traitement des données avec R à tous ceux qui doivent produire des statistiques descriptives, des graphiques et des exports de tableaux.Le contenu ne se limite pas à la modélisation statistique, mais il montre tout ce qu'il [...]
[lire le résumé du livre]
Auteur : Olivier DECOURT
Editeur : Dunod
Collection : InfoPro
Date parution : 03/2018Quel est le sujet du livre "Le langage R au quotidien"
Le langage R est un langage open source de traitement des données et d'analyse statistique.
L'objectif de cet ouvrage est d'apprendre le traitement des données avec R à tous ceux qui doivent produire des statistiques descriptives, des graphiques et des exports de tableaux.
Le contenu ne se limite pas à la modélisation statistique, mais il montre tout ce qu'il faut savoir faire avant, autour et après la construction du modèle qu'il s'agisse d'importation et de préparation des données ou de restitution des résultats.
Ce livre a été conçu pour tirer pleinement parti de R en se concentrant sur les outils les plus courants (packages de base, reshape2, dplyr, tidyr, data.table) et en proposant des exercices sur de très gros volumes de données.
Ces exercices accessibles en ligne utilisent des données en open data mises à disposition du public par AirBnB (réservation de 35 000 logements parisiens sur 700 jours).
Auteurs :
Formateur et consultant indépendant sur le traitement des données et l'analyse statistique. Il est l'auteur de deux ouvrages sur SAS chez Dunod.
En suivant ce lien, retrouvez tous les livres dans la spécialité Langages.
Sommaire et contenu du livre "Le langage R au quotidien - Traitement et analyse de données volumineuses. Mise en pratique avec exemples en Open Data"
Introduction à R. Les principes du langage. Scripts. Stockage d'information. Principaux types de données. Récupération des données. Filtres et requêtes. Création de variables. Tris et doublons; Jointures et empilements. Transposition. Statistiques descriptives. Graphiques et datavisualisation. Export et reporting.