On a regroupé dans un tableau ci-contre le choix de l’entrée (X) et celui du dessert (Y) des clients d’un nouveau restaurant du centre ville.
data <- data.frame( tarte = c(17, 15, 8), glace = c(12, 14, 12), mousse = c(8, 10, 20), row.names = c('crudité', 'charcuterie', 'oeuf mimosas'))
print(data)
## tarte glace mousse
## crudité 17 12 8
## charcuterie 15 14 10
## oeuf mimosas 8 12 20
En lisant cet énoncé, nous pouvons déjà récupérer les informations et les données utiles à notre inférence statistique.
Informations
Population : Clients d’un nouveau restaurant du centre ville.
Variables :
Données
print(data)
## tarte glace mousse
## crudité 17 12 8
## charcuterie 15 14 10
## oeuf mimosas 8 12 20
a <- 0.10
Nous rajoutons le seuil alpha 0.10 à notre environnement de données, en assignant 0.10 à l’objet a.
Hypothèses
H0 <- "on peut considérer que dans ce nouveau restaurant, le choix du dessert se fasse indépendamment du choix de l'entrée."
H1 <- "on peut considérer que dans ce nouveau restaurant, le choix du dessert se fasse dépendamment du choix de l'entrée."
Pour tout test d’indépendance (ou d’absence de relation) entre deux variables (Khi-deux d’indépendance, corrélation monotone ou linéaire), l’indépendance sera toujours notifié en H0. Cette règle vaut également pour les tests d’adéquations entre une variable et une loi (Khi-deux d’adéquation).
Test d’indépendance stochastique
Nous choisissons le test d’indépendance stochastique, car nous cherchons à vérifier l’existence d’une relation entre deux variables catégorielles.
result <- chisq.test(data, p = 1 - a)
p.value <- result[['p.value']]
Le test d’indépendance stochastique est possible grâce à la fonction chisq.test(), cette fonction prend comme arguments un ensemble de données (data) et un seuil de confiance (p = 1 - a ou 1 - 0.10. Donc 90 % de confiance envers notre résultat).
Resultats
print(result)
##
## Pearson's Chi-squared test
##
## data: data
## X-squared = 9.8673, df = 4, p-value = 0.04272
if(p.value < a){
answer <- paste('Il y a rejet de H0, car', p.value, 'est inférieur à', a, '. Donc,', H1)
} else {
answer <- paste('Il y a non rejet de H0, car', p.value, 'est supérieur à', a, '. Donc,', H0)
}
Étant donné que la p.value est inférieure à notre seuil alpha, nous décidons de rejeter H0 en faveur de H1.
Réponse : Il y a rejet de H0, car 0.0427225932460489 est inférieur à 0.1 . Donc, on peut considérer que dans ce nouveau restaurant, le choix du dessert se fasse dépendamment du choix de l’entrée.