Lire un fichier csv sur le web

PATH <- 'http://ziedzaier.com/wp-content/uploads/2019/07/mtcars.csv'
mtcars <- read.csv(PATH, header =  TRUE, sep = ',',stringsAsFactors =FALSE)

dim(mtcars)
[1] 32 12
names(mtcars)
 [1] "X"    "mpg"  "cyl"  "disp" "hp"   "drat" "wt"   "qsec" "vs"   "am"   "gear" "carb"
head(mtcars)
NA
library(ggplot2)

tracer un diagramme de dispersion des variables mpg et drat. un fichier pdf avec le graphique est cree dans votre repertoire de projet

p <- ggplot(mtcars, aes(x = drat, y = mpg)) +
    geom_point()
print(p)

Sauvegarder le Graphe en format png

ggsave("mon_premier_graphe.png")
Saving 7 x 7 in image

distinguer les valeurs d’un groupe de données - gear

p <- ggplot(mtcars, aes(x = mpg, y = drat)) +
    geom_point(aes(color = factor(gear)))
print(p)

rendre vos données moins sensibles aux valeurs aberrantes avec le redimensionnement - echelle logarithmique

p <-ggplot(mtcars, aes(x = log(mpg), y = log(drat))) +
    geom_point(aes(color = factor(am)))
print(p)

Ajouter un autre niveau d’information au graphique en tracant la valeur ajustée d’une régression linéaire. L’argument stat_smooth () contrôle la méthode de lissage - method = “lm”: régression linéaire col = “# C42126”: Code de la couleur rouge de la ligne et se = FALSE: ne pas afficher l’erreur standard size = 1: l’épaisseur de la ligne est 1

mon_graphe <- ggplot(mtcars, aes(x = log(mpg), y = log(drat))) +
    geom_point(aes(color = factor(vs))) +
    stat_smooth(method = "lm",
        col = "yellow",
        se = FALSE,
        size = 1)
print(mon_graphe)

ajouter votre titre

mon_graphe <-mon_graphe +
    labs(
        title = "Dispersion des variables mpg et drat"
         ) + 
  xlab('Valeur de log(draf)') + 
  ylab('Valeur de log(mpg)') 

print(mon_graphe)

library(ggplot2)

bar chart basique un count sur la variable cyl

p <- ggplot(mtcars, aes(x = factor(cyl))) +
    geom_bar() +
    labs(
        title = "Bar chart basique un count sur la variable cyl"
         ) + 
  xlab('Nombre de cylindres') + 
  ylab('Nombre de données') 

print(p)

Changer la couleur des barres

p <- ggplot(mtcars, aes(x = factor(cyl))) +
    geom_bar(fill = "blue") +
    theme_classic()+
    labs(
        title = "Bar chart basique un count sur la variable cyl"
         ) + 
  xlab('Nombre de cylindres') + 
  ylab('Nombre de données') 
print(p)

Couleur par groupe

p <- ggplot(mtcars, aes(factor(cyl),
        fill = factor(cyl))) +
    geom_bar() +
    theme_classic()+
    labs(
        title = "Bar chart basique un count sur la variable cyl"
         ) + 
  xlab('Nombre de cylindres') + 
  ylab('Nombre de données') 
print(p)

library(dplyr)

Ajouter un autre niveau de groupe

data <- mtcars %>%
mutate(am = factor(am, labels = c("auto", "man")),
    cyl = factor(cyl))
p <- ggplot(data, aes(x = cyl, fill = am)) +
    geom_bar() +
    theme_bw() +
    labs(
        title = "Bar chart basique un count sur la variable cyl"
         ) + 
  xlab('Nombre de cylindres') + 
  ylab('Nombre de données') 

print(p)

Multi Barres

p <- ggplot(data, aes(x = cyl, fill = am)) +
    geom_bar(position = position_dodge()) +
    theme_bw()+
    labs(
        title = "Multi Barres  basique le count sur la variable cyl en factor AM"
         ) + 
  xlab('Nombre de cylindres') + 
  ylab('Nombre de données') 
print(p)

Vous créez un bloc de données nommé donnee_histograme qui renvoie simplement la moyenne par le nombre de cylindres dans la voiture. appeler cette nouvelle variable moyenne_mpg et arrondissez la moyenne avec deux décimales.

donnee_histograme <- mtcars %>%
mutate(cyl = factor(cyl)) %>%
group_by(cyl)  %>% summarize(moyenne_mpg = round(mean(mpg), 2))

Vous pouvez tracer l’histogramme. La variable cyl fait référence à l’axe des x et moyenne_mpg à l’axe des y. Vous devez passer l’argument stat = “identity” pour référencer la variable sur l’axe des ordonnées en tant que valeur numérique. geom_bar utilise stat = “bin” comme valeur par défaut. Vous modifiez l’orientation du graphique de vertical à horizontal avec coord_flip()


graphe <- ggplot(donnee_histograme, aes(x = cyl, y = moyenne_mpg, fill = cyl)) +
    geom_bar(stat = "identity",
        width = 0.5) +
    coord_flip() +
    theme_classic()
print(graphe)

graphe <- graphe + geom_text(aes(label = moyenne_mpg),
        hjust = 1.5,
        color = "white",
        size = 3) +
    theme_classic()

print(graphe)

lire un fichier csv sur le web

PATH <- 'http://ziedzaier.com/wp-content/uploads/2019/07/airquality.csv'
qualite_air <- read.csv(PATH, header =  TRUE, sep = ',',stringsAsFactors =FALSE)
print(head(qualite_air,5))
library(dplyr)
library(ggplot2)

Importer les données

donnee_air <- qualite_air %>%
  select(-c(Solar.R, Temp)) %>%
  mutate(Month = factor(Month, order = TRUE, labels = c("May", "June", "July", "August", "September")),
         jour_divise = factor(ifelse(Day < 10, "debut", ifelse(Day < 20, "milieu", "fin"))))
donnee_air_pas_na <-donnee_air %>% na.omit()

Supprimez les variables inutiles

onvertir le mois en facteur

Créez une nouvelle variable catégorique divisant le mois en trois niveaux: début, milieu et fin.

Supprimer les observations manquantes

Stocker le graphique Vous passez l’ensemble de données donnee_air_pas_na à ggplot. Dans l’argument aes (), vous ajoutez les axes x et y.

box_plot <- ggplot(donnee_air_pas_na, aes(x = Month, y = Ozone))

Ajouter le tracé de la boîte à objets géométriques Utilisez geom_boxplot () pour créer un diagramme en moustache

box_plot <- box_plot +
    geom_boxplot()
print(box_plot)

---
title: "BD7 R pratique"
Auteur: ZZaier
refait par: JZ8
Date: 2019-10-01
output: html_notebook
---

Lire un fichier csv sur le web

```{r}
PATH <- 'http://ziedzaier.com/wp-content/uploads/2019/07/mtcars.csv'
mtcars <- read.csv(PATH, header =  TRUE, sep = ',',stringsAsFactors =FALSE)

```

```{r}

dim(mtcars)

```
```{r}
names(mtcars)
```


```{r}
head(mtcars)

```


```{r}
library(ggplot2)
```

tracer un diagramme de dispersion des variables mpg et drat.
un fichier pdf avec le graphique est cree dans votre repertoire de projet
```{r}
p <- ggplot(mtcars, aes(x = drat, y = mpg)) +
    geom_point()
print(p)
```

Sauvegarder le Graphe en format png
```{r}
ggsave("mon_premier_graphe.png")
```
distinguer les valeurs d’un groupe de données - gear
```{r}
p <- ggplot(mtcars, aes(x = mpg, y = drat)) +
    geom_point(aes(color = factor(gear)))
print(p)
```


rendre vos données moins sensibles aux valeurs aberrantes avec le redimensionnement - echelle logarithmique

```{r}
p <-ggplot(mtcars, aes(x = log(mpg), y = log(drat))) +
    geom_point(aes(color = factor(am)))
print(p)
```

Ajouter un autre niveau d’information au graphique en tracant la valeur ajustée d'une régression linéaire.
 L'argument stat_smooth () contrôle la méthode de lissage - method = "lm": régression linéaire
col = "# C42126": Code de la couleur rouge de la ligne et se = FALSE: ne pas afficher l'erreur standard
 size = 1: l'épaisseur  de la ligne est 1

```{r}
mon_graphe <- ggplot(mtcars, aes(x = log(mpg), y = log(drat))) +
    geom_point(aes(color = factor(vs))) +
    stat_smooth(method = "lm",
        col = "yellow",
        se = FALSE,
        size = 1)
print(mon_graphe)
```

ajouter votre titre
```{r}
mon_graphe <-mon_graphe +
    labs(
        title = "Dispersion des variables mpg et drat"
         ) + 
  xlab('Valeur de log(draf)') + 
  ylab('Valeur de log(mpg)') 

print(mon_graphe)
```

```{r}
library(ggplot2)
```

bar chart basique un count sur la variable cyl
```{r}
p <- ggplot(mtcars, aes(x = factor(cyl))) +
    geom_bar() +
    labs(
        title = "Bar chart basique un count sur la variable cyl"
         ) + 
  xlab('Nombre de cylindres') + 
  ylab('Nombre de données') 

print(p)
```

Changer la couleur des barres
```{r}
p <- ggplot(mtcars, aes(x = factor(cyl))) +
    geom_bar(fill = "blue") +
    theme_classic()+
    labs(
        title = "Bar chart basique un count sur la variable cyl"
         ) + 
  xlab('Nombre de cylindres') + 
  ylab('Nombre de données') 
print(p)
```

Couleur par groupe

```{r}
p <- ggplot(mtcars, aes(factor(cyl),
        fill = factor(cyl))) +
    geom_bar() +
    theme_classic()+
    labs(
        title = "Bar chart basique un count sur la variable cyl"
         ) + 
  xlab('Nombre de cylindres') + 
  ylab('Nombre de données') 
print(p)
```


```{r}
library(dplyr)
```

Ajouter un autre niveau de groupe
```{r}
data <- mtcars %>%
mutate(am = factor(am, labels = c("auto", "man")),
    cyl = factor(cyl))
p <- ggplot(data, aes(x = cyl, fill = am)) +
    geom_bar() +
    theme_bw() +
    labs(
        title = "Bar chart basique un count sur la variable cyl"
         ) + 
  xlab('Nombre de cylindres') + 
  ylab('Nombre de données') 

print(p)
```

Multi Barres
```{r}
p <- ggplot(data, aes(x = cyl, fill = am)) +
    geom_bar(position = position_dodge()) +
    theme_bw()+
    labs(
        title = "Multi Barres  basique le count sur la variable cyl en factor AM"
         ) + 
  xlab('Nombre de cylindres') + 
  ylab('Nombre de données') 
print(p)
```

Vous créez un bloc de données nommé donnee_histograme qui renvoie 
simplement la moyenne par le nombre de cylindres dans la voiture. 
appeler cette nouvelle variable moyenne_mpg et arrondissez la moyenne avec deux décimales.
```{r}
donnee_histograme <- mtcars %>%
mutate(cyl = factor(cyl)) %>%
group_by(cyl)  %>% summarize(moyenne_mpg = round(mean(mpg), 2))
```

Vous pouvez tracer l'histogramme.
La variable cyl fait référence à l'axe des x et moyenne_mpg à l'axe des y.
Vous devez passer l'argument stat = "identity" pour référencer la variable sur l'axe des ordonnées
 en tant que valeur numérique. geom_bar utilise stat = "bin" comme valeur par défaut.
Vous modifiez l'orientation du graphique de vertical à horizontal avec coord_flip()
```{r}

graphe <- ggplot(donnee_histograme, aes(x = cyl, y = moyenne_mpg, fill = cyl)) +
    geom_bar(stat = "identity",
        width = 0.5) +
    coord_flip() +
    theme_classic()
print(graphe)
```

```{r}
graphe <- graphe + geom_text(aes(label = moyenne_mpg),
        hjust = 1.5,
        color = "white",
        size = 3) +
    theme_classic()

print(graphe)
```
lire un fichier csv sur le web

```{r}
PATH <- 'http://ziedzaier.com/wp-content/uploads/2019/07/airquality.csv'
qualite_air <- read.csv(PATH, header =  TRUE, sep = ',',stringsAsFactors =FALSE)
print(head(qualite_air,5))
```

```{r}
library(dplyr)
library(ggplot2)
```

Importer les données
```{r}
donnee_air <- qualite_air %>%
  select(-c(Solar.R, Temp)) %>%
  mutate(Month = factor(Month, order = TRUE, labels = c("May", "June", "July", "August", "September")),
         jour_divise = factor(ifelse(Day < 10, "debut", ifelse(Day < 20, "milieu", "fin"))))
donnee_air_pas_na <-donnee_air %>% na.omit()
```
Supprimez les variables inutiles
```{r}

```

onvertir le mois en facteur
```{r}


```

Créez une nouvelle variable catégorique divisant le mois en trois niveaux: début, milieu et fin.
```{r}


```

Supprimer les observations manquantes
```{r}

```

Stocker le graphique
Vous passez l'ensemble de données donnee_air_pas_na à ggplot.
Dans l'argument aes (), vous ajoutez les axes x et y.
```{r}
box_plot <- ggplot(donnee_air_pas_na, aes(x = Month, y = Ozone))

```


Ajouter le tracé de la boîte à objets géométriques
Utilisez geom_boxplot () pour créer un diagramme en moustache

```{r}
box_plot <- box_plot +
    geom_boxplot()
print(box_plot)
```

