Après seulement quinze ans d'existence, le logiciel R est devenu un outil incontournable de statistique et de visualisation de données tant dans le monde universitaire que dans celui de l'entreprise. Ce développement exceptionnel s'explique par ses trois principales qualités: il est gratuit, très complet et en essor permanent.Ce livre [...] [lire le résumé du livre]
Après seulement quinze ans d'existence, le logiciel R est devenu un outil incontournable de statistique et de visualisation de données tant dans le monde universitaire que dans celui de l'entreprise.
Ce développement exceptionnel s'explique par ses trois principales qualités: il est gratuit, très complet et en essor permanent. Ce livre s'articule en deux grandes parties: la première est centrée sur le fonctionnement du logiciel R tandis que la seconde met en oeuvre une vingtaine de méthodes statistiques au travers de fiches. Ces fiches sont chacune basées sur un exemple concret et balayent un large spectre de techniques classiques en traitement de données.
Ce livre s'adresse aux débutants comme aux utilisateurs réguliers de R. Il leur permettra de réaliser rapidement des graphiques et des traitements statistiques simples ou élaborés.
Pour cette troisième édition, le texte a été révisé et augmenté et cette nouvelle édition est en couleurs. Certaines fiches ont été complétées, de nouveaux exercices ont été ajoutés, la visualisation de résultats sur des cartes est proposée.
Sommaire et contenu du livre "Statistiques avec R"
Sommaire
1 Le logiciel R et son fonctionnement 1
1 Concepts 3
1.1
Installation de R ..... 3
1.2
La session de travail ... 3
1.2.1
Session sous Linux 4
1.2.2
Session sous Windows 4
1.2.3
Session sous Mac 5
1.3
Les différentes aides . 5
1.3.1
L'aide en ligne . 5
1.3.2
L'aide sur le CRAN 6
1.4
Les objets R. 6
1.4.1
Création, affichage, suppression 6
1.4.2
Le type d'un objet .. 7
1.4.3
La valeur manquante. 8
1.4.4
Les vecteurs. 9
1.4.5
Les matrices 13
1.4.6
L€s facteurs . 18
1.4.7
Les listes .. 19
1.4.8
Les data-frames . 22
1.5
Lesfonctions . . . . . . 22
1.5.1
Les arguments d'une fonction 23
1.5.2
Les sorties . 23
1.6
Les packages . 24
1.6.1
Qu'est-ce qu'un package? .. 24
1.6.2
Comment installer un package? . 24
1.6.3
Mise à jour des packages. . . . 25
1.6.4
Comment utiliser un package? 26
1.7
Exercices . 26
2 Manipuler les données 29
2.1
Importer des données. 29
2.2
Exporter des résultats 33
2.3
Manipuler les variables. 34
2.3.1
Changer de type 34
2.3.2
Découpage en classes. 35
2.3.3
Travail sur le niveau des facteurs 36
2.4
Manipuler les individus . 39
2.4.1
Repérer les données manquantes 39
2.4.2
Repérer les individus aberrants 42
2.5
Concaténer des tableaux de données 43
2.6
Tableau croisé. 46
2.7
Exercices . 48
3 Représenter les données 51
3.1
Les fonctions graphiques conventionnelles 51
3.1.1
La fonction plot . 52
3.1.2
Représentation d'une distribution. 58
3.1.3
Ajouts aux graphiques . 59
3.1.4
Graphiques en plusieurs dimensions 62
3.1.5
Exportation de graphiques. 64
3.1.6
Plusieurs graphiques . 66
3.1.7
Plusieursfenêtres . . . . . . . . . . . 67
3.1.8
Amélioration et personnalisation des graphiques 68
3.2
Les fonctions graphiques avec lattice . 71
3.2.1
Caractéristiques d'un graphique de type « lattice » 73
3.2.2
Formule et groupes . 74
3.2.3
Personnalisation des graphiques. 76
3.2.4
Exportation . 79
3.2.5
Autres packages . 79
3.3
Manipuler des fonds de cartes . . 80
3.3.1
Fonds de cartes « pleins» 80
3.3.2
Fonds de cartes «shapefile » figurant des bordures 82
3.4
Exercices .. . 84
4 Programmer en R 91
4.1
Structures de contrôle . 91
4.1.1
Commandes groupées .. 91
4.1.2
Les boucles (for ou while) 91
4.1.3
Les conditions (if, else) 93
4.2
Les fonctions prédéfinies 94
4.3
Construire une fonction 101
11)<'
4.4 Exercices
II Les fiches 105
5 StartR 107
6 Fiches 111
6.1
Intervalle de confiance d'une moyenne 112
6.2
Test du X2 d'indépendance ..... 116
6.3
Comparaison de deux moyennes . . . . 121
6.4
Test de conformité d'une proportion . 127
6.5
Comparaison de plusieurs proportions 129
6.6
Puissance d'un test . 131
6.7
Régression simple . 134
6.8
Régressionmultiple........... 141
6.9
Régression Partial Least Square (PLS) 147
6.10
Analyse de la variance à un facteur .. 155
6.11
Analyse de la variance avec interaction. 163
6.12
Analyse de la covariance .... 169
6.13
Analyse discriminante linéaire. 176
6.14
Régression logistique . 184
6.15
Arbrededécision . . . . . . . . 192
6.16
Analyse en Composantes Principales 201
6.17
Analyse Factorielle des Correspondances 212
6.18
Analyse des Correspondances Multiples 219
6.19
Classification Ascendante Hiérarchique . 230
6.20
Méthode des K-means . 239
Annexes 243
A.1
Les fonctions les plus utiles . 243
A.2
Ecriture d'une formule pour les modèles 252
A.3
Le package Rcmdr ... 253
A.4
Le package FactoMineR .... 255
A.5
Correction des exercices . . . . 257
A.5.1
Exercices du chapitre 1 257
A.5.2
Exercices du chapitre 2 264
A.5.3
Exercices du chapitre 3 272
A.5.4
Exercices du chapitre 4 282
Bibliographie 285
Index des fonctions 287
Index 291
Avis clients
Avis clients sur Statistiques avec R - presses universitaires de rennes - Pratique de la statistique
(Ils sont modérés par nos soins et rédigés par des clients ayant acheté l'ouvrage)
Nous utilisons des cookies pour assurer le bon fonctionnement du site et améliorer votre expérience-utilisateur.
Ce site respecte la loi RGPD du 25 mai 2018.
Vous pouvez modifier vos préférences à tout moment.
Consulter notre politique de confidentialité
Nécessaires
Les cookies nécessaires contribuent à rendre un site web utilisable en activant des fonctions de base comme la navigation de page et l'accès aux zones sécurisées du site web. Le site web ne peut pas fonctionner correctement sans ces cookies.
Statistiques
Les cookies statistiques aident les propriétaires du site web, par la collecte et la communication d'informations de manière anonyme, à comprendre comment les visiteurs interagissent avec les sites web.
Marketing
Les cookies marketing sont utilisés pour effectuer le suivi des visiteurs au travers des sites web. Le but est d'afficher des publicités qui sont pertinentes et intéressantes pour l'utilisateur individuel et donc plus précieuses pour les éditeurs et annonceurs tiers.