Mon premier document Quarto

Karim Kilani

Introduction

Bla bla

Running Code

When you click the Render button a document will be generated that includes both content and the output of embedded code. You can embed code like this:

chunk

1 + 1
[1] 2
x<-1:20 # une liste avec tous les nombres de 1 à 20
 # Une liste de dates de 1970 à 2026 années bisxtiles
dates<-seq(1970,2026,4)
sum(x) # somme des nombres qui se trouvent dans la liste x
[1] 210

You can add options to executable code like this

[1] 4

The echo: false option disables the printing of code (only output is displayed).

curve(x^3-3*x^2,-5,5)

curve(exp(x),-1,1)

curve(log(x),0,4)

Travail avec des données

df<-mtcars

names(df)
 [1] "mpg"  "cyl"  "disp" "hp"   "drat" "wt"   "qsec" "vs"   "am"   "gear"
[11] "carb"
df$mpg 
 [1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.2 10.4
[16] 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7
[31] 15.0 21.4
df[,1]
 [1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.2 10.4
[16] 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7
[31] 15.0 21.4
df[1:3,1]
[1] 21.0 21.0 22.8
df$hp
 [1] 110 110  93 110 175 105 245  62  95 123 123 180 180 180 205 215 230  66  52
[20]  65  97 150 150 245 175  66  91 113 264 175 335 109
mean(df$mpg) # Moyenne de la variable mpg 
[1] 20.09062
sd(df$mpg) # Ecart-type de la variable mpg 
[1] 6.026948
median(df$mpg) # Médiane
[1] 19.2
max(df$mpg) # Le maximum
[1] 33.9
min(df$mpg) # Le minimum
[1] 10.4
sort(df$mpg)
 [1] 10.4 10.4 13.3 14.3 14.7 15.0 15.2 15.2 15.5 15.8 16.4 17.3 17.8 18.1 18.7
[16] 19.2 19.2 19.7 21.0 21.0 21.4 21.4 21.5 22.8 22.8 24.4 26.0 27.3 30.4 30.4
[31] 32.4 33.9
hist(df$mpg,col = "red",xlab="Miles per Gallon",ylab = "Nombre de modèles")

rownames(df)
 [1] "Mazda RX4"           "Mazda RX4 Wag"       "Datsun 710"         
 [4] "Hornet 4 Drive"      "Hornet Sportabout"   "Valiant"            
 [7] "Duster 360"          "Merc 240D"           "Merc 230"           
[10] "Merc 280"            "Merc 280C"           "Merc 450SE"         
[13] "Merc 450SL"          "Merc 450SLC"         "Cadillac Fleetwood" 
[16] "Lincoln Continental" "Chrysler Imperial"   "Fiat 128"           
[19] "Honda Civic"         "Toyota Corolla"      "Toyota Corona"      
[22] "Dodge Challenger"    "AMC Javelin"         "Camaro Z28"         
[25] "Pontiac Firebird"    "Fiat X1-9"           "Porsche 914-2"      
[28] "Lotus Europa"        "Ford Pantera L"      "Ferrari Dino"       
[31] "Maserati Bora"       "Volvo 142E"         
table(df$am) # Tableau de fréquence

 0  1 
19 13 

Une manière moderne de traiter les données

Le tidyverse

library(tidyverse)
mtcars|>tibble() # J'ai transformé le df en format tibble
# A tibble: 32 × 11
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
 1  21       6  160    110  3.9   2.62  16.5     0     1     4     4
 2  21       6  160    110  3.9   2.88  17.0     0     1     4     4
 3  22.8     4  108     93  3.85  2.32  18.6     1     1     4     1
 4  21.4     6  258    110  3.08  3.22  19.4     1     0     3     1
 5  18.7     8  360    175  3.15  3.44  17.0     0     0     3     2
 6  18.1     6  225    105  2.76  3.46  20.2     1     0     3     1
 7  14.3     8  360    245  3.21  3.57  15.8     0     0     3     4
 8  24.4     4  147.    62  3.69  3.19  20       1     0     4     2
 9  22.8     4  141.    95  3.92  3.15  22.9     1     0     4     2
10  19.2     6  168.   123  3.92  3.44  18.3     1     0     4     4
# ℹ 22 more rows
mtcars$mpg
 [1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.2 10.4
[16] 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7
[31] 15.0 21.4
mtcars|>tibble()|>select(1,2)
# A tibble: 32 × 2
     mpg   cyl
   <dbl> <dbl>
 1  21       6
 2  21       6
 3  22.8     4
 4  21.4     6
 5  18.7     8
 6  18.1     6
 7  14.3     8
 8  24.4     4
 9  22.8     4
10  19.2     6
# ℹ 22 more rows
mtcars|>tibble()|>select(mpg,cyl)|>filter(mpg<15)
# A tibble: 5 × 2
    mpg   cyl
  <dbl> <dbl>
1  14.3     8
2  10.4     8
3  10.4     8
4  14.7     8
5  13.3     8
tbmtcars<-mtcars|>tibble()

tbmtcars|>ggplot(aes(cyl,mpg))+geom_point(col="red")+
  ggtitle("mpg vs. cylindrée", subtitle = "Données mtcars")+xlab("Cylindrée")+
  ylab("mpg")+annotate("text", x = 6, y = 20, 
         label = "Voilà des voitures plus raisonnables",
         vjust = -3)

library(ggthemes)
tbmtcars|>ggplot()+aes(x = cyl, y = mpg) +
  geom_point(color = "red") +
  geom_smooth(method = "lm", color = "blue", se = TRUE) +
  labs(
    x = "Nombre de cylindres (cyl)",
    y = "Consommation (mpg)",
    title = "Relation entre nombre de cylindres et consommation"
  ) +
  theme_economist()
`geom_smooth()` using formula = 'y ~ x'

# Commentaire : on observe une tendance inverse entre cyl et mpg ; les véhicules à 4 cylindres sont plus économes que ceux à 6 ou 8 cylindres.
# La droite de régression linéaire (en bleu) a une pente négative, confirmant que chaque cylindre supplémentaire réduit en moyenne la consommation (mpg).

Créer des variables