Statistiques descriptives des variables quantitatives

Data

Nous allons ici employer les données description :`

CI_Iso_HID <- read.csv("C:/Users/mallah.s/Desktop/StatsTheses/These_Romane/Av_Ap/avec_HID/CI_Iso_HID.csv", sep=";", stringsAsFactors=TRUE)

library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.0.5
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.2     v dplyr   1.0.7
## v tidyr   1.1.3     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.1
## Warning: package 'ggplot2' was built under R version 4.0.5
## Warning: package 'tibble' was built under R version 4.0.5
## Warning: package 'tidyr' was built under R version 4.0.5
## Warning: package 'dplyr' was built under R version 4.0.5
## Warning: package 'forcats' was built under R version 4.0.5
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
CI_1 <-CI_Iso_HID %>% 
       pivot_longer(cols=c(CI_isoP_0 ,CI_isoP1),names_to="periode" ,values_to = "CI_IsoP" )
CI_1$periode<- fct_relevel(CI_1$periode, c("CI_isoP_0" ,"CI_isoP1"))
head(CI_1)
## # A tibble: 6 x 3
##   patient_ID periode   CI_IsoP
##   <fct>      <fct>       <int>
## 1 3_T        CI_isoP_0    1770
## 2 3_T        CI_isoP1     2210
## 3 4_T        CI_isoP_0    1860
## 4 4_T        CI_isoP1     1700
## 5 5_T        CI_isoP_0     770
## 6 5_T        CI_isoP1     1120

schema évolution VR(ml) des patients

ggplot(CI_1 , aes(x=periode, y=CI_IsoP, colour=patient_ID)) + 
      geom_point()+
       geom_line(aes(group=patient_ID))+
       theme_classic()+
       theme(legend.position = "none")

schema par patient

ggplot(CI_1, aes(x=periode, y=CI_IsoP, colour=patient_ID)) + 
    geom_point()+
    geom_line(aes(group=patient_ID))+
    theme_classic()+
    theme(legend.position = "none")+
    facet_wrap(~patient_ID)

##Calcul de la Difference

CI_Iso_HID$d <- CI_Iso_HID$CI_isoP_0-CI_Iso_HID$CI_isoP1
head(CI_Iso_HID)
##   patient_ID CI_isoP_0 CI_isoP1    d
## 1        3_T      1770     2210 -440
## 2        4_T      1860     1700  160
## 3        5_T       770     1120 -350
## 4        8_T      1440     1350   90
## 5       10_T      1040      800  240
## 6       11_T      1670     1850 -180

Evaluation de la condition de validité

library(car)
## Warning: package 'car' was built under R version 4.0.5
## Loading required package: carData
## 
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode
## The following object is masked from 'package:purrr':
## 
##     some
qqPlot(CI_Iso_HID$d)

## [1]  7 14

la normalité est globalement satisfaisante malgres quelques imperfections

shapiro.test(CI_Iso_HID$d)
## 
##  Shapiro-Wilk normality test
## 
## data:  CI_Iso_HID$d
## W = 0.95969, p-value = 0.1975

Le test de Shapiro-Wilk ne rejette pas l’hypothèse de normalité, pvalue>0.05. Au final, nous acceptons cette hypothèse. Nous allons donc pouvoir comparer les moyennes des VEMS avant et après traitement, à l’aide d’un test t apparié:

Test de Student apparié

t.test(CI_Iso_HID$CI_isoP_0 , CI_Iso_HID$CI_isoP1, paired=TRUE)
## 
##  Paired t-test
## 
## data:  CI_Iso_HID$CI_isoP_0 and CI_Iso_HID$CI_isoP1
## t = -2.8224, df = 36, p-value = 0.007715
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -346.96715  -56.81663
## sample estimates:
## mean of the differences 
##               -201.8919

L’évolution des moyennes de la CI_IsoP entre les deux périodes est de 201.8ml /equivalent à une diminution de 13.89% . La p-value du test est <0.05. Ainsi, les résultats nous indiquent que la CI_IsoP des sujets après traitement est significativement différente de la CI_IsoP avant celui-ci, dans le sens d’une croissance.

si nous calculons le pourcentage de decroissance par rapport à la moyenne

summary(CI_Iso_HID)
##    patient_ID   CI_isoP_0       CI_isoP1          d          
##  1_L    : 1   Min.   : 700   Min.   : 800   Min.   :-1210.0  
##  10_L   : 1   1st Qu.:1110   1st Qu.:1350   1st Qu.: -390.0  
##  10_T   : 1   Median :1470   Median :1610   Median : -170.0  
##  11_L   : 1   Mean   :1454   Mean   :1656   Mean   : -201.9  
##  11_T   : 1   3rd Qu.:1770   3rd Qu.:1870   3rd Qu.:  120.0  
##  12_L   : 1   Max.   :2450   Max.   :2580   Max.   :  640.0  
##  (Other):31

pour le calcul du pourcentage d’evolution: on utilise la formule ((y2 - y1) / y1)*100 = taux d’ évolution Y1=1454 Y2=1656 Pourcentage d’évolution de la VEMS est de 13.89 %