Sur un échantillon de 12 femmes enceintes, on a dosé l’hormone lactogène dans le sang (variable X) et dans le liquide amniotique (variable Y). Voici les taux mesurés en ng/ml :
data <- data.frame( X = c(12, 8, 15, 13, 11, 12, 16, 9, 7, 13, 10, 13), Y = c(4.8, 3.9, 7.3, 6.7, 4.3, 5.6, 7.1, 4.3, 5.7, 6.3, 4.9, 4.1))
print(data)
## X Y
## 1 12 4.8
## 2 8 3.9
## 3 15 7.3
## 4 13 6.7
## 5 11 4.3
## 6 12 5.6
## 7 16 7.1
## 8 9 4.3
## 9 7 5.7
## 10 13 6.3
## 11 10 4.9
## 12 13 4.1
En lisant cet énoncé, nous pouvons déjà récupérer les informations et les données utiles à notre inférence statistique.
Informations
Population : Hormones de femmes enceintes.
Variables :
Données
print(data)
## X Y
## 1 12 4.8
## 2 8 3.9
## 3 15 7.3
## 4 13 6.7
## 5 11 4.3
## 6 12 5.6
## 7 16 7.1
## 8 9 4.3
## 9 7 5.7
## 10 13 6.3
## 11 10 4.9
## 12 13 4.1
a <- 0.05
Notre consigne ne prédétermine pas de seuil alpha, nous allons donc le placer à 0.5 (objet a).
Hypothèses
H0 <- "on ne peut pas conclure que le taux de lactogène dans le sang des femmes enceintes, soit en relation linéaire avec leur taux de lactogène dans leur liquide amniotique."
H1 <- "on peut conclure que le taux de lactogène dans le sang des femmes enceintes, soit en relation linéaire avec leur taux de lactogène dans leur liquide amniotique."
Pour tout test d’absence de relation (ou d’indépendance) entre deux variables (Khi-deux d’indépendance, corrélation monotone ou linéaire), l’absence de relation sera toujours notifiée en H0. Cette règle vaut également pour les tests d’adéquations entre une variable et une loi (Khi-deux d’adéquation).
Test de corrélation linéaire
Petit rappel : Un coefficient de corrélation monotone (SPEARMAN), vérifie que l’évolution d’une variable X, entraîne l’évolution de la variable Y dans le même sens (pour une corrélation positive) ou dans le sens inverse (pour une corrélation négative). Un coefficient de corrélation linéaire (BRAVAIS-PEARSON), cherche à vérifier si ces deux évolutions ce font à une même vitesse.
Nous choisissons le test de corrélation linéaire, car nous cherchons à vérifier l’absence de relation entre deux variables numériques. Il est plus pertinent d’utiliser un test d’indépendance stochastique pour les variables catégorielles.
result <- with(data, cor.test(X, Y, alternative = 'two.sided', method = 'pearson', conf.level = 1 - a))
p.value <- result[['p.value']]
Le test de corrélation linéaire est possible grâce à la fonction cor.test(). Cette fonction prend comme arguments une variable x, une variable y, le sens de l’hypothèse alternative (alternative = ‘two.sided’ ou ‘less’ ou ‘greater’), une methode (method = ‘pearson’ ou ‘kendall’ ou ‘spearman’) et un seuil de confiance (p = 1 - a ou 1 - 0.05. Donc 95 % de confiance envers notre résultat).
Resultats
print(result)
##
## Pearson's product-moment correlation
##
## data: X and Y
## t = 2.6899, df = 10, p-value = 0.02271
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.1178292 0.8906419
## sample estimates:
## cor
## 0.6479171
if(p.value < a){
answer <- paste('Il y a rejet de H0, car', p.value, 'est inférieur à', a, '. Donc,', H1)
} else {
answer <- paste('Il y a non rejet de H0, car', p.value, 'est supérieur à', a, '. Donc,', H0)
}
Étant donné que la p.value est inférieure à notre seuil alpha, nous décidons de rejeter H0 en faveur de H1.
Réponse : Il y a rejet de H0, car 0.0227052422580423 est inférieur à 0.05 . Donc, on peut conclure que le taux de lactogène dans le sang des femmes enceintes, soit en relation linéaire avec leur taux de lactogène dans leur liquide amniotique.
Données
print(data)
## X Y
## 1 12 4.8
## 2 8 3.9
## 3 15 7.3
## 4 13 6.7
## 5 11 4.3
## 6 12 5.6
## 7 16 7.1
## 8 9 4.3
## 9 7 5.7
## 10 13 6.3
## 11 10 4.9
## 12 13 4.1
a <- 0.05
Nous maintenons notre seuil alpha à 0.05.
Hypothèses
H0 <- "on ne peut pas conclure que le taux de lactogène dans le sang des femmes enceintes, soit en relation monotone avec leur taux de lactogène dans leur liquide amniotique."
H1 <- "on peut conclure que le taux de lactogène dans le sang des femmes enceintes, soit en relation monotone avec leur taux de lactogène dans leur liquide amniotique."
Pour tout test d’absence de relation (ou d’indépendance) entre deux variables (Khi-deux d’indépendance, corrélation monotone ou linéaire), l’absence de relation sera toujours notifiée en H0. Cette règle vaut également pour les tests d’adéquations entre une variable et une loi (Khi-deux d’adéquation).
Test de corrélation monotone
Petit rappel : Un coefficient de corrélation monotone (SPEARMAN), vérifie que l’évolution d’une variable X, entraîne l’évolution de la variable Y dans le même sens (pour une corrélation positive) ou dans le sens inverse (pour une corrélation négative). Un coefficient de corrélation linéaire (BRAVAIS-PEARSON), cherche à vérifier que ces deux évolutions se fassent à une même vitesse.
Nous choisissons le test de corrélation monotone, car nous cherchons à vérifier l’absence de relation monotone entre deux variables numériques. Il est plus pertinent d’utiliser un test d’indépendance stochastique pour les variables catégorielles.
result <- with(data, cor.test(X, Y, alternative = 'two.sided', method = 'spearman', conf.level = 1 - a, exact = FALSE))
p.value <- result[['p.value']]
Le test de corrélation monotone est possible grâce à la fonction cor.test(). Cette fonction prend comme arguments une variable x, une variable y, le sens de l’hypothèse alternative (alternative = ‘two.sided’ ou ‘less’ ou ‘greater’), une methode (method = ‘pearson’ ou ‘kendall’ ou ‘spearman’) et un seuil de confiance (p = 1 - a ou 1 - 0.05. Donc 95 % de confiance envers notre résultat). De plus, l’argument (exact = FALSE) permet d’éviter le message d’erreur : “Cannot compute exact p-value with ties”
Resultats
print(result)
##
## Spearman's rank correlation rho
##
## data: X and Y
## S = 112.17, p-value = 0.03604
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.607789
if(p.value < a){
answer <- paste('Il y a rejet de H0, car', p.value, 'est inférieur à', a, '. Donc,', H1)
} else {
answer <- paste('Il y a non rejet de H0, car', p.value, 'est supérieur à', a, '. Donc,', H0)
}
Étant donné que la p.value est inférieure à notre seuil alpha, nous décidons de rejeter H0 en faveur de H1.
Réponse : Il y a rejet de H0, car 0.0360399348179522 est inférieur à 0.05 . Donc, on peut conclure que le taux de lactogène dans le sang des femmes enceintes, soit en relation monotone avec leur taux de lactogène dans leur liquide amniotique.