TD 4 : Graphiques et packages

Support, données et interro

Packages

1) Utilisez le panneau Packages de RStudio pour installer les packages ggplot2 et readr.

2) Chargez chacun des deux packages précédents afin de pouvoir les utiliser dans le reste du TD.

Importation

3) Rendez-vous sur la page du cours et téléchargez les données utilisées pour ce cours (diamonds.csv).

4) Importez dans R les données téléchargées précédemment. Vérifiez que vous obtenez bien un dataframe.

5) Combien de lignes et de colonnes comporte ce dataframe ? Regardez le type des colonnes et leurs noms.

Scatter plot

6) Utilisez la commande pour créer un scatter plot afin de chercher une corrélation entre deux variables du dataframe.

7) Ajoutez à votre graphique un titre, et un label sur les axes X et Y.

8) Nous avons les informations sur la couleur des diamants (color) et leur découpe (cut). Intégrez ces informations à la visualisation précédente.

Line

9) Enlevez les arguments de couleur et de découpe de la question précédente, et modifiez votre code pour obtenir une ligne au lieu des points.

10) Refaites le graphique précédent mais en étudiant seulement les diamants à la coupe idéale.

11) Rajoutez au graphique précédent l’information de couleur des diamants idéaux.

Régression

12) Utilisez plusieurs geom à la fois en combinant point et smooth. Quelle information est ajoutée ?

13) Essayez de combiner les geom point et line. Est-ce une visualisation utile ?

Histogram

14) Réalisez un histogram avec les diamants (en visualisant les carats par exemple).

15) Introduisez l’information de couleur dans l’histogramme précédent.

Exportation

16) Modifiez le dataframe pour ne garder que les diamants dont le prix est 5 000$. Exportez ce nouveau dataframe dans un fichier nommé “diamants-chers.csv”.

17) Videz votre environnement (toutes les variables enregistrées) pour repartir à zéro, grâce à l’icone en forme de balais dans le panneau environnement. Chargez ensuite “diamants-chers.csv”.