knitr::opts_chunk$set(echo = TRUE)
summary(PV_Retro)
## numero.d.inclusion groupe.patient AGE SEXE POIDS_kg
## Min. : 1.00 PV : 41 Min. :18.0 Féminin : 25 Min. :45.0
## 1st Qu.: 21.25 Retro:121 1st Qu.:23.0 Masculin:137 1st Qu.:58.0
## Median : 42.50 Median :27.0 Median :63.0
## Mean : 53.49 Mean :28.7 Mean :63.9
## 3rd Qu.: 85.75 3rd Qu.:33.0 3rd Qu.:69.0
## Max. :128.00 Max. :54.0 Max. :96.0
## NA's :57
## TAILLE_m IMC TABAC. nbr.de.PA cannabis.
## Min. :1.480 Min. :15.5 : 9 Min. : 0.25 :38
## 1st Qu.:1.730 1st Qu.:18.3 Non : 23 1st Qu.: 5.00 Non :41
## Median :1.770 Median :20.0 Oui :119 Median :10.00 Oui :71
## Mean :1.777 Mean :20.2 sevré: 11 Mean :10.66 sevré:12
## 3rd Qu.:1.820 3rd Qu.:21.3 3rd Qu.:15.00
## Max. :1.950 Max. :29.3 Max. :30.00
## NA's :57 NA's :57 NA's :83
## PROFESSION COMORBIDITES. Ptx
## :77 : 3 Droit :89
## etudiant : 3 Aucun :117 Gauche:73
## étudiant : 3 Autre : 30
## informaticien: 3 CARDIOVASC: 5
## ingénieur : 3 METAB : 3
## bâtiment : 2 RESPI : 4
## (Other) :71
## durée.des.symptomes.avant.drainage_jour symptomes.dyspnée
## Min. : 1.000 : 6
## 1st Qu.: 1.000 Non:73
## Median : 1.000 Oui:83
## Mean : 1.672
## 3rd Qu.: 1.000
## Max. :15.000
## NA's :25
## symptomes.douleurs.thoraciques ambulatoire._pleuralvent hospitalisation..
## : 6 Non:125 Non: 23
## Non: 1 Oui: 37 Oui:139
## Oui:155
##
##
##
##
## taille.du.drain type.de.drain.initial
## Min. : 8.00 cook : 7
## 1st Qu.: 8.50 Fuhrman :85
## Median :16.00 Monaldi :22
## Mean :13.95 PleuralVent:41
## 3rd Qu.:18.00 Pleurocath : 7
## Max. :20.00
## NA's :143
## mise.en.aspiration..au.drainage.initial..
## :136
## Non: 3
## Oui: 23
##
##
##
##
## mise.en.aspiration..au.cours.de.la.prise.en.charge.
## :89
## Oui:73
##
##
##
##
##
## nombre.de.jours.de.drainage nombres.d.heures.de.bullage oxygénothérapie
## Min. : 1.00 Min. : 1.00 Non:124
## 1st Qu.: 2.00 1st Qu.: 1.00 Oui: 38
## Median : 4.00 Median : 24.00
## Mean : 4.34 Mean : 51.23
## 3rd Qu.: 6.00 3rd Qu.: 96.00
## Max. :13.00 Max. :168.00
## NA's :109
## NOMBRE.DE..CS_SUR.1.AN_.pour.psp DECOUVERTE.pathologie.sous.jacente
## Min. :0.000 :152
## 1st Qu.:1.000 emphyseme : 8
## Median :1.000 emphyseme+BPCO: 1
## Mean :1.745 endometriose : 1
## 3rd Qu.:2.000
## Max. :6.000
## NA's :1
## Nbre.de.CHIRURGIE.sur.1.an REDRAINAGE._SUR.1.AN. Nbre.RECIDIVE._SUR.REC_1.AN.
## XIR_0:105 exsufflation: 1 REC_0:127
## XIR_1: 50 Non :130 REC_1: 32
## XIR_2: 7 Oui : 31 REC_2: 2
## REC_3: 1
##
##
##
## coté.recidive INFECTION. hemothorax.. décès.
## :128 Non :154 Epanchement : 1 Non:162
## controlaterale : 4 parenchyme: 8 hemothorax minime: 1
## homolat+controlat: 1 Non :160
## homolaterale : 29
##
##
##
## materiel.intrathoracique. œdème.de.rééxpansion. emphysème.sous.cutané.
## Non:161 Non:157 Non:154
## Oui: 1 Oui: 5 Oui: 8
##
##
##
##
##
## autres..complications Déviation.médiastinale NHA Poumon.au.hile
## Non :161 Non :116 Non :129 Non :97
## suspi hémoptysie: 1 Oui : 39 Oui : 26 Oui :58
## NA's: 7 NA's: 7 NA's: 7
##
##
##
##
## Ptx.de.grande.abondance.
## Oui:162
##
##
##
##
##
##
## Ptx.persistant.de.grande..abondance.à.la.RT..post.drainage.immédiat
## Non:144
## Oui: 18
##
##
##
##
##
## drainage NOMBRE_DE_RT_SUR_1_AN NOMBRE.DE..TDM_SUR.1.AN
## anterieur:34 Min. : 3.00 : 1
## axillaire:87 1st Qu.: 7.00 TDM_0:122
## PV :41 Median : 9.00 TDM_1: 34
## Mean :11.27 TDM_2: 5
## 3rd Qu.:15.00
## Max. :35.00
## NA's :1
## bons.de.transport. CONSOMMATION..D.ANTALGIQUES._LE.PREMIER.MOIS X.PALIER.1.
## :121 Mode:logical :158
## Non: 41 NA's:162 Oui: 4
##
##
##
##
##
## doses.cumulées MORPHINIQUES doses.cumulées.1 Duree_hospit_jour
## Mode:logical :160 Mode:logical Mode:logical
## NA's:162 Non: 2 NA's:162 NA's:162
##
##
##
##
##
## duree_arret_travail_jour
## Min. : 2.00
## 1st Qu.:12.00
## Median :21.00
## Mean :22.96
## 3rd Qu.:30.00
## Max. :82.00
## NA's :94
describe(PV_Retro,num.desc=c("mean","median","sd","valid.n"),xname=NA,horizontal=FALSE)
## PV_Retro
##
## 54 Variables 162 Observations
## --------------------------------------------------------------------------------
## numero.d.inclusion
## n missing distinct Info Mean Gmd .05 .10
## 162 0 123 1 53.49 43.36 5.00 9.00
## .25 .50 .75 .90 .95
## 21.25 42.50 85.75 111.90 119.95
##
## lowest : 1 2 3 4 5, highest: 124 125 126 127 128
## --------------------------------------------------------------------------------
## groupe.patient
## n missing distinct
## 162 0 2
##
## Value PV Retro
## Frequency 41 121
## Proportion 0.253 0.747
## --------------------------------------------------------------------------------
## AGE
## n missing distinct Info Mean Gmd .05 .10
## 162 0 30 0.997 28.7 8.212 19.00 20.10
## .25 .50 .75 .90 .95
## 23.00 27.00 33.00 38.00 42.95
##
## lowest : 18 19 20 21 22, highest: 43 44 47 53 54
## --------------------------------------------------------------------------------
## SEXE
## n missing distinct
## 162 0 2
##
## Value Féminin Masculin
## Frequency 25 137
## Proportion 0.154 0.846
## --------------------------------------------------------------------------------
## POIDS_kg
## n missing distinct Info Mean Gmd .05 .10
## 105 57 40 0.998 63.9 11.32 50.0 51.4
## .25 .50 .75 .90 .95
## 58.0 63.0 69.0 77.0 81.8
##
## lowest : 45 46.5 48 50 51 , highest: 85 90 92 95 96
## --------------------------------------------------------------------------------
## TAILLE_m
## n missing distinct Info Mean Gmd .05 .10
## 105 57 30 0.996 1.777 0.09252 1.650 1.694
## .25 .50 .75 .90 .95
## 1.730 1.770 1.820 1.890 1.918
##
## lowest : 1.48 1.56 1.6 1.62 1.65, highest: 1.91 1.92 1.93 1.94 1.95
## --------------------------------------------------------------------------------
## IMC
## n missing distinct Info Mean Gmd .05 .10
## 105 57 62 0.999 20.2 2.882 16.74 17.38
## .25 .50 .75 .90 .95
## 18.30 20.00 21.30 23.36 25.38
##
## lowest : 15.5 15.9 16.1 16.3 16.6, highest: 25.7 26.3 27.8 28.4 29.3
## --------------------------------------------------------------------------------
## TABAC.
## n missing distinct
## 162 0 4
##
## Value Non Oui sevré
## Frequency 9 23 119 11
## Proportion 0.056 0.142 0.735 0.068
## --------------------------------------------------------------------------------
## nbr.de.PA
## n missing distinct Info Mean Gmd .05 .10
## 79 83 20 0.98 10.66 7.823 2.0 3.7
## .25 .50 .75 .90 .95
## 5.0 10.0 15.0 20.0 25.0
##
## Value 0.25 1.00 2.00 2.50 4.00 5.00 6.00 7.00 8.00 9.00 10.00
## Frequency 1 1 5 1 3 16 2 3 3 1 17
## Proportion 0.013 0.013 0.063 0.013 0.038 0.203 0.025 0.038 0.038 0.013 0.215
##
## Value 11.00 12.00 14.00 15.00 18.00 20.00 22.00 25.00 30.00
## Frequency 1 1 1 7 2 7 1 4 2
## Proportion 0.013 0.013 0.013 0.089 0.025 0.089 0.013 0.051 0.025
##
## For the frequency table, variable is rounded to the nearest 0
## --------------------------------------------------------------------------------
## cannabis.
## n missing distinct
## 162 0 4
##
## Value Non Oui sevré
## Frequency 38 41 71 12
## Proportion 0.235 0.253 0.438 0.074
## --------------------------------------------------------------------------------
## PROFESSION
## n missing distinct
## 162 0 71
##
## lowest : achalandage rayons aeronautique/chômage airbus airbus cablage avions
## highest: stewart technicien usine/chaines motorisées vente piece auto web-designer
## --------------------------------------------------------------------------------
## COMORBIDITES.
## n missing distinct
## 162 0 6
##
## Value Aucun Autre CARDIOVASC METAB RESPI
## Frequency 3 117 30 5 3 4
## Proportion 0.019 0.722 0.185 0.031 0.019 0.025
## --------------------------------------------------------------------------------
## Ptx
## n missing distinct
## 162 0 2
##
## Value Droit Gauche
## Frequency 89 73
## Proportion 0.549 0.451
## --------------------------------------------------------------------------------
## durée.des.symptomes.avant.drainage_jour
## n missing distinct Info Mean Gmd .05 .10
## 137 25 10 0.468 1.672 1.223 1 1
## .25 .50 .75 .90 .95
## 1 1 1 3 5
##
## Value 1 2 3 4 5 6 7 9 10 15
## Frequency 111 11 4 3 2 1 1 1 1 2
## Proportion 0.810 0.080 0.029 0.022 0.015 0.007 0.007 0.007 0.007 0.015
##
## For the frequency table, variable is rounded to the nearest 0
## --------------------------------------------------------------------------------
## symptomes.dyspnée
## n missing distinct
## 162 0 3
##
## Value Non Oui
## Frequency 6 73 83
## Proportion 0.037 0.451 0.512
## --------------------------------------------------------------------------------
## symptomes.douleurs.thoraciques
## n missing distinct
## 162 0 3
##
## Value Non Oui
## Frequency 6 1 155
## Proportion 0.037 0.006 0.957
## --------------------------------------------------------------------------------
## ambulatoire._pleuralvent
## n missing distinct
## 162 0 2
##
## Value Non Oui
## Frequency 125 37
## Proportion 0.772 0.228
## --------------------------------------------------------------------------------
## hospitalisation..
## n missing distinct
## 162 0 2
##
## Value Non Oui
## Frequency 23 139
## Proportion 0.142 0.858
## --------------------------------------------------------------------------------
## taille.du.drain
## n missing distinct Info Mean Gmd
## 19 143 6 0.946 13.95 5.187
##
## Value 8.0 8.5 14.0 16.0 18.0 20.0
## Frequency 1 6 2 3 5 2
## Proportion 0.053 0.316 0.105 0.158 0.263 0.105
##
## For the frequency table, variable is rounded to the nearest 0
## --------------------------------------------------------------------------------
## type.de.drain.initial
## n missing distinct
## 162 0 5
##
## Value cook Fuhrman Monaldi PleuralVent Pleurocath
## Frequency 7 85 22 41 7
## Proportion 0.043 0.525 0.136 0.253 0.043
## --------------------------------------------------------------------------------
## mise.en.aspiration..au.drainage.initial..
## n missing distinct
## 162 0 3
##
## Value Non Oui
## Frequency 136 3 23
## Proportion 0.840 0.019 0.142
## --------------------------------------------------------------------------------
## mise.en.aspiration..au.cours.de.la.prise.en.charge.
## n missing distinct
## 162 0 2
##
## Value Oui
## Frequency 89 73
## Proportion 0.549 0.451
## --------------------------------------------------------------------------------
## nombre.de.jours.de.drainage
## n missing distinct Info Mean Gmd .05 .10
## 162 0 12 0.97 4.34 2.71 2 2
## .25 .50 .75 .90 .95
## 2 4 6 8 9
##
## Value 1 2 3 4 5 6 7 8 9 11 12
## Frequency 5 43 31 21 14 16 12 8 7 3 1
## Proportion 0.031 0.265 0.191 0.130 0.086 0.099 0.074 0.049 0.043 0.019 0.006
##
## Value 13
## Frequency 1
## Proportion 0.006
##
## For the frequency table, variable is rounded to the nearest 0
## --------------------------------------------------------------------------------
## nombres.d.heures.de.bullage
## n missing distinct Info Mean Gmd
## 53 109 9 0.961 51.23 53.49
##
## Value 1 12 24 48 72 96 120 144 168
## Frequency 15 1 11 4 8 4 8 1 1
## Proportion 0.283 0.019 0.208 0.075 0.151 0.075 0.151 0.019 0.019
##
## For the frequency table, variable is rounded to the nearest 0
## --------------------------------------------------------------------------------
## oxygénothérapie
## n missing distinct
## 162 0 2
##
## Value Non Oui
## Frequency 124 38
## Proportion 0.765 0.235
## --------------------------------------------------------------------------------
## NOMBRE.DE..CS_SUR.1.AN_.pour.psp
## n missing distinct Info Mean Gmd
## 161 1 7 0.906 1.745 1.457
##
## Value 0 1 2 3 4 5 6
## Frequency 21 70 32 17 12 6 3
## Proportion 0.130 0.435 0.199 0.106 0.075 0.037 0.019
##
## For the frequency table, variable is rounded to the nearest 0
## --------------------------------------------------------------------------------
## DECOUVERTE.pathologie.sous.jacente
## n missing distinct
## 162 0 4
##
## Value emphyseme emphyseme+BPCO endometriose
## Frequency 152 8 1 1
## Proportion 0.938 0.049 0.006 0.006
## --------------------------------------------------------------------------------
## Nbre.de.CHIRURGIE.sur.1.an
## n missing distinct
## 162 0 3
##
## Value XIR_0 XIR_1 XIR_2
## Frequency 105 50 7
## Proportion 0.648 0.309 0.043
## --------------------------------------------------------------------------------
## REDRAINAGE._SUR.1.AN.
## n missing distinct
## 162 0 3
##
## Value exsufflation Non Oui
## Frequency 1 130 31
## Proportion 0.006 0.802 0.191
## --------------------------------------------------------------------------------
## Nbre.RECIDIVE._SUR.REC_1.AN.
## n missing distinct
## 162 0 4
##
## Value REC_0 REC_1 REC_2 REC_3
## Frequency 127 32 2 1
## Proportion 0.784 0.198 0.012 0.006
## --------------------------------------------------------------------------------
## coté.recidive
## n missing distinct
## 162 0 4
##
## Value controlaterale homolat+controlat
## Frequency 128 4 1
## Proportion 0.790 0.025 0.006
##
## Value homolaterale
## Frequency 29
## Proportion 0.179
## --------------------------------------------------------------------------------
## INFECTION.
## n missing distinct
## 162 0 2
##
## Value Non parenchyme
## Frequency 154 8
## Proportion 0.951 0.049
## --------------------------------------------------------------------------------
## hemothorax..
## n missing distinct
## 162 0 3
##
## Value Epanchement hemothorax minime Non
## Frequency 1 1 160
## Proportion 0.006 0.006 0.988
## --------------------------------------------------------------------------------
## décès.
## n missing distinct value
## 162 0 1 Non
##
## Value Non
## Frequency 162
## Proportion 1
## --------------------------------------------------------------------------------
## materiel.intrathoracique.
## n missing distinct
## 162 0 2
##
## Value Non Oui
## Frequency 161 1
## Proportion 0.994 0.006
## --------------------------------------------------------------------------------
## œdème.de.rééxpansion.
## n missing distinct
## 162 0 2
##
## Value Non Oui
## Frequency 157 5
## Proportion 0.969 0.031
## --------------------------------------------------------------------------------
## emphysème.sous.cutané.
## n missing distinct
## 162 0 2
##
## Value Non Oui
## Frequency 154 8
## Proportion 0.951 0.049
## --------------------------------------------------------------------------------
## autres..complications
## n missing distinct
## 162 0 2
##
## Value Non suspi hémoptysie
## Frequency 161 1
## Proportion 0.994 0.006
## --------------------------------------------------------------------------------
## Déviation.médiastinale
## n missing distinct
## 155 7 2
##
## Value Non Oui
## Frequency 116 39
## Proportion 0.748 0.252
## --------------------------------------------------------------------------------
## NHA
## n missing distinct
## 155 7 2
##
## Value Non Oui
## Frequency 129 26
## Proportion 0.832 0.168
## --------------------------------------------------------------------------------
## Poumon.au.hile
## n missing distinct
## 155 7 2
##
## Value Non Oui
## Frequency 97 58
## Proportion 0.626 0.374
## --------------------------------------------------------------------------------
## Ptx.de.grande.abondance.
## n missing distinct value
## 162 0 1 Oui
##
## Value Oui
## Frequency 162
## Proportion 1
## --------------------------------------------------------------------------------
## Ptx.persistant.de.grande..abondance.à.la.RT..post.drainage.immédiat
## n missing distinct
## 162 0 2
##
## Value Non Oui
## Frequency 144 18
## Proportion 0.889 0.111
## --------------------------------------------------------------------------------
## drainage
## n missing distinct
## 162 0 3
##
## Value anterieur axillaire PV
## Frequency 34 87 41
## Proportion 0.210 0.537 0.253
## --------------------------------------------------------------------------------
## NOMBRE_DE_RT_SUR_1_AN
## n missing distinct Info Mean Gmd .05 .10
## 161 1 27 0.994 11.27 6.614 5 5
## .25 .50 .75 .90 .95
## 7 9 15 19 22
##
## lowest : 3 4 5 6 7, highest: 27 28 29 32 35
## --------------------------------------------------------------------------------
## NOMBRE.DE..TDM_SUR.1.AN
## n missing distinct
## 162 0 4
##
## Value TDM_0 TDM_1 TDM_2
## Frequency 1 122 34 5
## Proportion 0.006 0.753 0.210 0.031
## --------------------------------------------------------------------------------
## bons.de.transport.
## n missing distinct
## 162 0 2
##
## Value Non
## Frequency 121 41
## Proportion 0.747 0.253
## --------------------------------------------------------------------------------
## X.PALIER.1.
## n missing distinct
## 162 0 2
##
## Value Oui
## Frequency 158 4
## Proportion 0.975 0.025
## --------------------------------------------------------------------------------
## MORPHINIQUES
## n missing distinct
## 162 0 2
##
## Value Non
## Frequency 160 2
## Proportion 0.988 0.012
## --------------------------------------------------------------------------------
## duree_arret_travail_jour
## n missing distinct Info Mean Gmd .05 .10
## 68 94 32 0.996 22.96 16.28 4.0 6.7
## .25 .50 .75 .90 .95
## 12.0 21.0 30.0 42.0 53.3
##
## lowest : 2 3 4 5 6, highest: 52 54 57 58 82
## --------------------------------------------------------------------------------
##
## Variables with all observations missing:
##
## [1] CONSOMMATION..D.ANTALGIQUES._LE.PREMIER.MOIS
## [2] doses.cumulées
## [3] doses.cumulées.1
## [4] Duree_hospit_jour
by(PV_Retro, PV_Retro$groupe.patient, summary)
## PV_Retro$groupe.patient: PV
## numero.d.inclusion groupe.patient AGE SEXE
## Min. : 1 PV :41 Min. :18.00 Féminin : 9
## 1st Qu.:11 Retro: 0 1st Qu.:22.00 Masculin:32
## Median :21 Median :26.00
## Mean :21 Mean :27.83
## 3rd Qu.:31 3rd Qu.:32.00
## Max. :41 Max. :54.00
##
## POIDS_kg TAILLE_m IMC TABAC. nbr.de.PA
## Min. :45.00 Min. :1.480 Min. :16.90 : 4 Min. : 1.000
## 1st Qu.:54.75 1st Qu.:1.720 1st Qu.:18.20 Non : 7 1st Qu.: 5.000
## Median :61.50 Median :1.785 Median :19.40 Oui :28 Median : 7.500
## Mean :62.50 Mean :1.772 Mean :19.88 sevré: 2 Mean : 9.222
## 3rd Qu.:70.00 3rd Qu.:1.870 3rd Qu.:20.82 3rd Qu.:10.000
## Max. :95.00 Max. :1.950 Max. :27.80 Max. :30.000
## NA's :13 NA's :13 NA's :13 NA's :23
## cannabis. PROFESSION COMORBIDITES. Ptx
## : 8 :16 : 3 Droit :22
## Non :11 étudiant : 3 Aucun :29 Gauche:19
## Oui :16 électricien: 2 Autre : 4
## sevré: 6 etudiant : 2 CARDIOVASC: 1
## étudiante : 2 METAB : 1
## ingénieur : 2 RESPI : 3
## (Other) :14
## durée.des.symptomes.avant.drainage_jour symptomes.dyspnée
## Min. : 1.000 : 1
## 1st Qu.: 1.000 Non:20
## Median : 1.000 Oui:20
## Mean : 1.865
## 3rd Qu.: 2.000
## Max. :15.000
## NA's :4
## symptomes.douleurs.thoraciques ambulatoire._pleuralvent hospitalisation..
## : 1 Non: 4 Non:23
## Non: 1 Oui:37 Oui:18
## Oui:39
##
##
##
##
## taille.du.drain type.de.drain.initial
## Min. : NA cook : 0
## 1st Qu.: NA Fuhrman : 0
## Median : NA Monaldi : 0
## Mean :NaN PleuralVent:41
## 3rd Qu.: NA Pleurocath : 0
## Max. : NA
## NA's :41
## mise.en.aspiration..au.drainage.initial..
## :36
## Non: 0
## Oui: 5
##
##
##
##
## mise.en.aspiration..au.cours.de.la.prise.en.charge.
## :30
## Oui:11
##
##
##
##
##
## nombre.de.jours.de.drainage nombres.d.heures.de.bullage oxygénothérapie
## Min. : 2.000 Min. : NA Non:37
## 1st Qu.: 4.000 1st Qu.: NA Oui: 4
## Median : 6.000 Median : NA
## Mean : 6.317 Mean :NaN
## 3rd Qu.: 8.000 3rd Qu.: NA
## Max. :13.000 Max. : NA
## NA's :41
## NOMBRE.DE..CS_SUR.1.AN_.pour.psp DECOUVERTE.pathologie.sous.jacente
## Min. :1.000 :39
## 1st Qu.:2.000 emphyseme : 1
## Median :3.000 emphyseme+BPCO: 0
## Mean :3.366 endometriose : 1
## 3rd Qu.:4.000
## Max. :6.000
##
## Nbre.de.CHIRURGIE.sur.1.an REDRAINAGE._SUR.1.AN. Nbre.RECIDIVE._SUR.REC_1.AN.
## XIR_0:27 exsufflation: 0 REC_0:31
## XIR_1:13 Non :33 REC_1: 9
## XIR_2: 1 Oui : 8 REC_2: 0
## REC_3: 1
##
##
##
## coté.recidive INFECTION. hemothorax.. décès.
## :32 Non :40 Epanchement : 1 Non:41
## controlaterale : 2 parenchyme: 1 hemothorax minime: 1
## homolat+controlat: 0 Non :39
## homolaterale : 7
##
##
##
## materiel.intrathoracique. œdème.de.rééxpansion. emphysème.sous.cutané.
## Non:40 Non:39 Non:40
## Oui: 1 Oui: 2 Oui: 1
##
##
##
##
##
## autres..complications Déviation.médiastinale NHA Poumon.au.hile
## Non :40 Non :26 Non :27 Non :22
## suspi hémoptysie: 1 Oui : 8 Oui : 7 Oui :12
## NA's: 7 NA's: 7 NA's: 7
##
##
##
##
## Ptx.de.grande.abondance.
## Oui:41
##
##
##
##
##
##
## Ptx.persistant.de.grande..abondance.à.la.RT..post.drainage.immédiat
## Non:29
## Oui:12
##
##
##
##
##
## drainage NOMBRE_DE_RT_SUR_1_AN NOMBRE.DE..TDM_SUR.1.AN
## anterieur: 0 Min. : 3.00 : 0
## axillaire: 0 1st Qu.: 6.00 TDM_0:35
## PV :41 Median : 8.00 TDM_1: 6
## Mean : 9.25 TDM_2: 0
## 3rd Qu.:11.00
## Max. :25.00
## NA's :1
## bons.de.transport. CONSOMMATION..D.ANTALGIQUES._LE.PREMIER.MOIS X.PALIER.1.
## : 0 Mode:logical :37
## Non:41 NA's:41 Oui: 4
##
##
##
##
##
## doses.cumulées MORPHINIQUES doses.cumulées.1 Duree_hospit_jour
## Mode:logical :39 Mode:logical Mode:logical
## NA's:41 Non: 2 NA's:41 NA's:41
##
##
##
##
##
## duree_arret_travail_jour
## Min. : 3.00
## 1st Qu.:12.50
## Median :21.00
## Mean :22.32
## 3rd Qu.:29.50
## Max. :58.00
## NA's :19
## ------------------------------------------------------------
## PV_Retro$groupe.patient: Retro
## numero.d.inclusion groupe.patient AGE SEXE POIDS_kg
## Min. : 1.0 PV : 0 Min. :18 Féminin : 16 Min. :46.50
## 1st Qu.: 32.0 Retro:121 1st Qu.:23 Masculin:105 1st Qu.:58.00
## Median : 65.0 Median :27 Median :63.00
## Mean : 64.5 Mean :29 Mean :64.41
## 3rd Qu.: 96.0 3rd Qu.:34 3rd Qu.:68.50
## Max. :128.0 Max. :54 Max. :96.00
## NA's :44
## TAILLE_m IMC TABAC. nbr.de.PA cannabis.
## Min. :1.620 Min. :15.50 : 5 Min. : 0.25 :30
## 1st Qu.:1.730 1st Qu.:18.50 Non :16 1st Qu.: 5.00 Non :30
## Median :1.770 Median :20.10 Oui :91 Median :10.00 Oui :55
## Mean :1.778 Mean :20.32 sevré: 9 Mean :11.08 sevré: 6
## 3rd Qu.:1.810 3rd Qu.:21.70 3rd Qu.:15.00
## Max. :1.950 Max. :29.30 Max. :30.00
## NA's :44 NA's :44 NA's :60
## PROFESSION COMORBIDITES. Ptx
## :61 : 0 Droit :67
## bâtiment : 2 Aucun :88 Gauche:54
## chomage : 2 Autre :26
## Etudiant : 2 CARDIOVASC: 4
## informaticien: 2 METAB : 2
## lycéen : 2 RESPI : 1
## (Other) :50
## durée.des.symptomes.avant.drainage_jour symptomes.dyspnée
## Min. : 1.0 : 5
## 1st Qu.: 1.0 Non:53
## Median : 1.0 Oui:63
## Mean : 1.6
## 3rd Qu.: 1.0
## Max. :15.0
## NA's :21
## symptomes.douleurs.thoraciques ambulatoire._pleuralvent hospitalisation..
## : 5 Non:121 Non: 0
## Non: 0 Oui: 0 Oui:121
## Oui:116
##
##
##
##
## taille.du.drain type.de.drain.initial
## Min. : 8.00 cook : 7
## 1st Qu.: 8.50 Fuhrman :85
## Median :16.00 Monaldi :22
## Mean :13.95 PleuralVent: 0
## 3rd Qu.:18.00 Pleurocath : 7
## Max. :20.00
## NA's :102
## mise.en.aspiration..au.drainage.initial..
## :100
## Non: 3
## Oui: 18
##
##
##
##
## mise.en.aspiration..au.cours.de.la.prise.en.charge.
## :59
## Oui:62
##
##
##
##
##
## nombre.de.jours.de.drainage nombres.d.heures.de.bullage oxygénothérapie
## Min. :1.000 Min. : 1.00 Non:87
## 1st Qu.:2.000 1st Qu.: 1.00 Oui:34
## Median :3.000 Median : 24.00
## Mean :3.669 Mean : 51.23
## 3rd Qu.:5.000 3rd Qu.: 96.00
## Max. :9.000 Max. :168.00
## NA's :68
## NOMBRE.DE..CS_SUR.1.AN_.pour.psp DECOUVERTE.pathologie.sous.jacente
## Min. :0.000 :113
## 1st Qu.:1.000 emphyseme : 7
## Median :1.000 emphyseme+BPCO: 1
## Mean :1.192 endometriose : 0
## 3rd Qu.:2.000
## Max. :4.000
## NA's :1
## Nbre.de.CHIRURGIE.sur.1.an REDRAINAGE._SUR.1.AN. Nbre.RECIDIVE._SUR.REC_1.AN.
## XIR_0:78 exsufflation: 1 REC_0:96
## XIR_1:37 Non :97 REC_1:23
## XIR_2: 6 Oui :23 REC_2: 2
## REC_3: 0
##
##
##
## coté.recidive INFECTION. hemothorax.. décès.
## :96 Non :114 Epanchement : 0 Non:121
## controlaterale : 2 parenchyme: 7 hemothorax minime: 0
## homolat+controlat: 1 Non :121
## homolaterale :22
##
##
##
## materiel.intrathoracique. œdème.de.rééxpansion. emphysème.sous.cutané.
## Non:121 Non:118 Non:114
## Oui: 0 Oui: 3 Oui: 7
##
##
##
##
##
## autres..complications Déviation.médiastinale NHA Poumon.au.hile
## Non :121 Non:90 Non:102 Non:75
## suspi hémoptysie: 0 Oui:31 Oui: 19 Oui:46
##
##
##
##
##
## Ptx.de.grande.abondance.
## Oui:121
##
##
##
##
##
##
## Ptx.persistant.de.grande..abondance.à.la.RT..post.drainage.immédiat
## Non:115
## Oui: 6
##
##
##
##
##
## drainage NOMBRE_DE_RT_SUR_1_AN NOMBRE.DE..TDM_SUR.1.AN
## anterieur:34 Min. : 5.00 : 1
## axillaire:87 1st Qu.: 7.00 TDM_0:87
## PV : 0 Median :11.00 TDM_1:28
## Mean :11.94 TDM_2: 5
## 3rd Qu.:15.00
## Max. :35.00
##
## bons.de.transport. CONSOMMATION..D.ANTALGIQUES._LE.PREMIER.MOIS X.PALIER.1.
## :121 Mode:logical :121
## Non: 0 NA's:121 Oui: 0
##
##
##
##
##
## doses.cumulées MORPHINIQUES doses.cumulées.1 Duree_hospit_jour
## Mode:logical :121 Mode:logical Mode:logical
## NA's:121 Non: 0 NA's:121 NA's:121
##
##
##
##
##
## duree_arret_travail_jour
## Min. : 2.00
## 1st Qu.:12.00
## Median :21.00
## Mean :23.26
## 3rd Qu.:30.00
## Max. :82.00
## NA's :75
by(PV_Retro,PV_Retro$groupe.patient, summarytools::descr,heading=FALSE,transpose =TRUE)
## PV_Retro$groupe.patient: PV
## For best results printing list objects with summarytools, use print(x); if by() was used, use stby() instead
## Non-numerical variable(s) ignored: groupe.patient, SEXE, TABAC., cannabis., PROFESSION, COMORBIDITES., Ptx, symptomes.dyspnée, symptomes.douleurs.thoraciques, ambulatoire._pleuralvent, hospitalisation.., type.de.drain.initial, mise.en.aspiration..au.drainage.initial.., mise.en.aspiration..au.cours.de.la.prise.en.charge., oxygénothérapie, DECOUVERTE.pathologie.sous.jacente, Nbre.de.CHIRURGIE.sur.1.an, REDRAINAGE._SUR.1.AN., Nbre.RECIDIVE._SUR.REC_1.AN., coté.recidive, INFECTION., hemothorax.., décès., materiel.intrathoracique., œdème.de.rééxpansion., emphysème.sous.cutané., autres..complications, Déviation.médiastinale, NHA, Poumon.au.hile, Ptx.de.grande.abondance., Ptx.persistant.de.grande..abondance.à.la.RT..post.drainage.immédiat, drainage, NOMBRE.DE..TDM_SUR.1.AN, bons.de.transport., CONSOMMATION..D.ANTALGIQUES._LE.PREMIER.MOIS, X.PALIER.1., doses.cumulées, MORPHINIQUES, doses.cumulées.1, Duree_hospit_jour
## Group: groupe.patient = PV
##
## Mean Std.Dev Min Q1 Median Q3
## --------------------------------------------- ------- --------- ------- ------- -------- -------
## AGE 27.83 7.57 18.00 22.00 26.00 32.00
## durée.des.symptomes.avant.drainage_jour 1.86 2.46 1.00 1.00 1.00 2.00
## duree_arret_travail_jour 22.32 14.81 3.00 12.00 21.00 30.00
## IMC 19.88 2.47 16.90 18.20 19.40 20.85
## nbr.de.PA 9.22 7.42 1.00 5.00 7.50 10.00
## NOMBRE.DE..CS_SUR.1.AN_.pour.psp 3.37 1.43 1.00 2.00 3.00 4.00
## nombre.de.jours.de.drainage 6.32 2.88 2.00 4.00 6.00 8.00
## NOMBRE_DE_RT_SUR_1_AN 9.25 4.82 3.00 6.00 8.00 11.00
## nombres.d.heures.de.bullage NA NA NA NA NA NA
## numero.d.inclusion 21.00 11.98 1.00 11.00 21.00 31.00
## POIDS_kg 62.50 11.44 45.00 54.50 61.50 70.00
## taille.du.drain NA NA NA NA NA NA
## TAILLE_m 1.77 0.11 1.48 1.72 1.79 1.87
##
## Table: Table continues below
##
##
##
## Max MAD IQR CV Skewness
## --------------------------------------------- ------- ------- ------- ------ ----------
## AGE 54.00 5.93 10.00 0.27 1.20
## durée.des.symptomes.avant.drainage_jour 15.00 0.00 1.00 1.32 4.22
## duree_arret_travail_jour 58.00 13.34 17.00 0.66 0.95
## IMC 27.80 2.08 2.63 0.12 1.61
## nbr.de.PA 30.00 3.71 5.00 0.81 1.27
## NOMBRE.DE..CS_SUR.1.AN_.pour.psp 6.00 1.48 2.00 0.42 0.06
## nombre.de.jours.de.drainage 13.00 2.97 4.00 0.46 0.46
## NOMBRE_DE_RT_SUR_1_AN 25.00 4.45 5.00 0.52 1.14
## nombres.d.heures.de.bullage NA NA NA NA NA
## numero.d.inclusion 41.00 14.83 20.00 0.57 0.00
## POIDS_kg 95.00 12.60 15.25 0.18 0.66
## taille.du.drain NA NA NA NA NA
## TAILLE_m 1.95 0.11 0.15 0.06 -0.66
##
## Table: Table continues below
##
##
##
## SE.Skewness Kurtosis N.Valid Pct.Valid
## --------------------------------------------- ------------- ---------- --------- -----------
## AGE 0.37 1.61 41.00 100.00
## durée.des.symptomes.avant.drainage_jour 0.39 19.12 37.00 90.24
## duree_arret_travail_jour 0.49 0.34 22.00 53.66
## IMC 0.44 2.67 28.00 68.29
## nbr.de.PA 0.54 1.00 18.00 43.90
## NOMBRE.DE..CS_SUR.1.AN_.pour.psp 0.37 -0.97 41.00 100.00
## nombre.de.jours.de.drainage 0.37 -0.76 41.00 100.00
## NOMBRE_DE_RT_SUR_1_AN 0.37 1.07 40.00 97.56
## nombres.d.heures.de.bullage NA NA 0.00 NA
## numero.d.inclusion 0.37 -1.29 41.00 100.00
## POIDS_kg 0.44 0.26 28.00 68.29
## taille.du.drain NA NA 0.00 NA
## TAILLE_m 0.44 -0.19 28.00 68.29
## ------------------------------------------------------------
## PV_Retro$groupe.patient: Retro
## For best results printing list objects with summarytools, use print(x); if by() was used, use stby() instead
## Group: groupe.patient = Retro
##
## Mean Std.Dev Min Q1 Median Q3
## --------------------------------------------- ------- --------- ------- ------- -------- -------
## AGE 29.00 7.54 18.00 23.00 27.00 34.00
## durée.des.symptomes.avant.drainage_jour 1.60 2.02 1.00 1.00 1.00 1.00
## duree_arret_travail_jour 23.26 15.48 2.00 12.00 21.00 30.00
## IMC 20.32 2.74 15.50 18.50 20.10 21.70
## nbr.de.PA 11.08 7.05 0.25 5.00 10.00 15.00
## NOMBRE.DE..CS_SUR.1.AN_.pour.psp 1.19 0.84 0.00 1.00 1.00 2.00
## nombre.de.jours.de.drainage 3.67 1.96 1.00 2.00 3.00 5.00
## NOMBRE_DE_RT_SUR_1_AN 11.94 6.46 5.00 7.00 11.00 15.00
## nombres.d.heures.de.bullage 51.23 47.86 1.00 1.00 24.00 96.00
## numero.d.inclusion 64.50 37.50 1.00 32.00 65.00 96.00
## POIDS_kg 64.41 9.89 46.50 58.00 63.00 68.50
## taille.du.drain 13.95 4.60 8.00 8.50 16.00 18.00
## TAILLE_m 1.78 0.07 1.62 1.73 1.77 1.81
##
## Table: Table continues below
##
##
##
## Max MAD IQR CV Skewness
## --------------------------------------------- -------- ------- ------- ------ ----------
## AGE 54.00 7.41 11.00 0.26 1.01
## durée.des.symptomes.avant.drainage_jour 15.00 0.00 0.00 1.26 4.46
## duree_arret_travail_jour 82.00 13.34 18.00 0.67 1.28
## IMC 29.30 2.37 3.20 0.13 0.86
## nbr.de.PA 30.00 7.41 10.00 0.64 0.74
## NOMBRE.DE..CS_SUR.1.AN_.pour.psp 4.00 0.00 1.00 0.71 0.72
## nombre.de.jours.de.drainage 9.00 1.48 3.00 0.54 0.87
## NOMBRE_DE_RT_SUR_1_AN 35.00 5.93 8.00 0.54 1.16
## nombres.d.heures.de.bullage 168.00 34.10 95.00 0.93 0.56
## numero.d.inclusion 128.00 47.44 64.00 0.58 0.00
## POIDS_kg 96.00 7.41 10.50 0.15 0.96
## taille.du.drain 20.00 2.97 9.50 0.33 -0.20
## TAILLE_m 1.95 0.06 0.08 0.04 0.53
##
## Table: Table continues below
##
##
##
## SE.Skewness Kurtosis N.Valid Pct.Valid
## --------------------------------------------- ------------- ---------- --------- -----------
## AGE 0.22 1.08 121.00 100.00
## durée.des.symptomes.avant.drainage_jour 0.24 22.12 100.00 82.64
## duree_arret_travail_jour 0.35 2.69 46.00 38.02
## IMC 0.27 0.93 77.00 63.64
## nbr.de.PA 0.31 -0.36 61.00 50.41
## NOMBRE.DE..CS_SUR.1.AN_.pour.psp 0.22 0.47 120.00 99.17
## nombre.de.jours.de.drainage 0.22 -0.24 121.00 100.00
## NOMBRE_DE_RT_SUR_1_AN 0.22 1.05 121.00 100.00
## nombres.d.heures.de.bullage 0.33 -0.99 53.00 43.80
## numero.d.inclusion 0.22 -1.24 121.00 100.00
## POIDS_kg 0.27 0.97 77.00 63.64
## taille.du.drain 0.52 -1.76 19.00 15.70
## TAILLE_m 0.27 -0.10 77.00 63.64
library(car)
ggplot(PV_Retro, aes(y=groupe.patient, x=AGE, colour=AGE, fill=AGE))+
geom_jitter(height=0, width=0.25)+
geom_boxplot(alpha=0.5,notch=TRUE)
## Warning: The following aesthetics were dropped during statistical transformation:
## colour, fill
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
Le tableur ci-dessous ontre le tableau de comparaison entre les deux groupes PV Vs Retro
groupwiseMean(AGE~groupe.patient,data=PV_Retro, conf=0.95, digits=5)
## groupe.patient n Mean Conf.level Trad.lower Trad.upper
## 1 PV 41 27.829 0.95 25.439 30.219
## 2 Retro 121 29.000 0.95 27.643 30.357
Le test ci-dessous nous permet de verifier les conditions de validité du test de student:
shapiro.test(PV_Retro$AGE[PV_Retro$groupe.patient=="PV"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$AGE[PV_Retro$groupe.patient == "PV"]
## W = 0.89997, p-value = 0.001654
==> la normalité n’est pas accepté dans le groupe PV
shapiro.test(PV_Retro$AGE[PV_Retro$groupe.patient=="Retro"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$AGE[PV_Retro$groupe.patient == "Retro"]
## W = 0.92823, p-value = 6.894e-06
==> la normalité n’est pas accepté dans le groupe Retro
La normalité étant rejetée dans les deux groupes, nous devons employer un test de de Wilcoxon
var.test(PV_Retro$AGE ~ PV_Retro$groupe.patient)
##
## F test to compare two variances
##
## data: PV_Retro$AGE by PV_Retro$groupe.patient
## F = 1.0084, num df = 40, denom df = 120, p-value = 0.9398
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.6247346 1.7387114
## sample estimates:
## ratio of variances
## 1.008414
l’egalité des variances n’est pas rejetée
wilcox.test(PV_Retro$AGE ~ PV_Retro$groupe.patient)
##
## Wilcoxon rank sum test with continuity correction
##
## data: PV_Retro$AGE by PV_Retro$groupe.patient
## W = 2194, p-value = 0.2699
## alternative hypothesis: true location shift is not equal to 0
L’hypothèse nulle d’égalité des moyennes d’age n’est pas rejetée car la p-value est > 0.05. Ainsi, rien ne permet d’affirmer que les médianes d’ages des du groupe PV et du groupe Retro sont différentes. Pas de difference
ggplot(PV_Retro, aes(y=groupe.patient, x=POIDS_kg, colour=POIDS_kg, fill=POIDS_kg))+
geom_jitter(height=0, width=0.25)+
geom_boxplot(alpha=0.5,notch=TRUE)
## Warning: Removed 57 rows containing non-finite values (`stat_boxplot()`).
## Warning: The following aesthetics were dropped during statistical transformation:
## colour, fill
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
## Warning: Removed 57 rows containing missing values (`geom_point()`).
Le tableur ci-dessous ontre le tableau de comparaison entre les deux groupes PV Vs Retro
groupwiseMean(POIDS_kg~groupe.patient,data=PV_Retro, conf=0.95, digits=5)
## groupe.patient n Mean Conf.level Trad.lower Trad.upper
## 1 PV 41 NA 0.95 NA NA
## 2 Retro 121 NA 0.95 NA NA
Le test ci-dessous nous permet de verifier les conditions de validité du test de student:
shapiro.test(PV_Retro$POIDS_kg[PV_Retro$groupe.patient=="PV"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$POIDS_kg[PV_Retro$groupe.patient == "PV"]
## W = 0.9538, p-value = 0.2466
==> la normalité est accepté dans le groupe PV
shapiro.test(PV_Retro$POIDS_kg[PV_Retro$groupe.patient=="Retro"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$POIDS_kg[PV_Retro$groupe.patient == "Retro"]
## W = 0.93994, p-value = 0.001228
==> la normalité n’est pas accepté dans le groupe Retro
La normalité étant rejetée dans un des, nous devons employer un test de de Wilcoxon
var.test(PV_Retro$POIDS_kg~ PV_Retro$groupe.patient)
##
## F test to compare two variances
##
## data: PV_Retro$POIDS_kg by PV_Retro$groupe.patient
## F = 1.3395, num df = 27, denom df = 76, p-value = 0.3231
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.7470896 2.6415601
## sample estimates:
## ratio of variances
## 1.339458
l’egalité des variances n’est pas rejetée
wilcox.test(PV_Retro$POIDS_kg ~ PV_Retro$groupe.patient)
##
## Wilcoxon rank sum test with continuity correction
##
## data: PV_Retro$POIDS_kg by PV_Retro$groupe.patient
## W = 965.5, p-value = 0.4165
## alternative hypothesis: true location shift is not equal to 0
L’hypothèse nulle d’égalité des moyennes d’age n’est pas rejetée car la p-value est > 0.05. Ainsi, rien ne permet d’affirmer que les médianes de poids des du groupe PV et du groupe Retro sont différentes. Pas de difference
library(car)
ggplot(PV_Retro, aes(y=groupe.patient, x=TAILLE_m, colour=TAILLE_m, fill=AGE))+
geom_jitter(height=0, width=0.25)+
geom_boxplot(alpha=0.5,notch=TRUE)
## Warning: Removed 57 rows containing non-finite values (`stat_boxplot()`).
## Warning: The following aesthetics were dropped during statistical transformation:
## colour, fill
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
## Warning: Removed 57 rows containing missing values (`geom_point()`).
Le tableur ci-dessous ontre le tableau de comparaison entre les deux groupes PV Vs Retro
groupwiseMean(TAILLE_m~groupe.patient,data=PV_Retro, conf=0.95, digits=5)
## groupe.patient n Mean Conf.level Trad.lower Trad.upper
## 1 PV 41 NA 0.95 NA NA
## 2 Retro 121 NA 0.95 NA NA
Le test ci-dessous nous permet de verifier les conditions de validité du test de student:
shapiro.test(PV_Retro$TAILLE_m[PV_Retro$groupe.patient=="PV"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$TAILLE_m[PV_Retro$groupe.patient == "PV"]
## W = 0.95401, p-value = 0.2495
==> la normalité estaccepté dans le groupe PV
shapiro.test(PV_Retro$TAILLE_m[PV_Retro$groupe.patient=="Retro"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$TAILLE_m[PV_Retro$groupe.patient == "Retro"]
## W = 0.96262, p-value = 0.02319
==> la normalité n’est pas accepté dans le groupe Retro
La normalité étant rejetée dans les deux groupes, nous devons employer un test de de Wilcoxon
var.test(PV_Retro$TAILLE_m ~ PV_Retro$groupe.patient)
##
## F test to compare two variances
##
## data: PV_Retro$TAILLE_m by PV_Retro$groupe.patient
## F = 2.6753, num df = 27, denom df = 76, p-value = 0.000844
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 1.492163 5.275993
## sample estimates:
## ratio of variances
## 2.675302
l’egalité des variances est rejetée
wilcox.test(PV_Retro$TAILLE_m ~ PV_Retro$groupe.patient)
##
## Wilcoxon rank sum test with continuity correction
##
## data: PV_Retro$TAILLE_m by PV_Retro$groupe.patient
## W = 1126, p-value = 0.7302
## alternative hypothesis: true location shift is not equal to 0
L’hypothèse nulle d’égalité des moyennes d’age n’est pas rejetée car la p-value est > 0.05. Ainsi, rien ne permet d’affirmer que les médianes d’ages des du groupe PV et du groupe Retro sont différentes. Pas de difference
library(car)
ggplot(PV_Retro, aes(y=groupe.patient, x=nbr.de.PA, colour=nbr.de.PA, fill=nbr.de.PA))+
geom_jitter(height=0, width=0.25)+
geom_boxplot(alpha=0.5,notch=TRUE)
## Warning: Removed 83 rows containing non-finite values (`stat_boxplot()`).
## Warning: The following aesthetics were dropped during statistical transformation:
## colour, fill
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
## Warning: Removed 83 rows containing missing values (`geom_point()`).
Le tableur ci-dessous ontre le tableau de comparaison entre les deux groupes PV Vs Retro
groupwiseMean(nbr.de.PA~groupe.patient,data=PV_Retro, conf=0.95, digits=5)
## groupe.patient n Mean Conf.level Trad.lower Trad.upper
## 1 PV 41 NA 0.95 NA NA
## 2 Retro 121 NA 0.95 NA NA
Le test ci-dessous nous permet de verifier les conditions de validité du test de student:
shapiro.test(PV_Retro$nbr.de.PA[PV_Retro$groupe.patient=="PV"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$nbr.de.PA[PV_Retro$groupe.patient == "PV"]
## W = 0.85829, p-value = 0.01147
==> la normalité n’est pas accepté dans le groupe PV
shapiro.test(PV_Retro$nbr.de.PA[PV_Retro$groupe.patient=="Retro"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$nbr.de.PA[PV_Retro$groupe.patient == "Retro"]
## W = 0.91703, p-value = 0.0005218
==> la normalité n’est pas accepté dans le groupe Retro
La normalité étant rejetée dans les deux groupes, nous devons employer un test de de Wilcoxon
var.test(PV_Retro$nbr.de.PA ~ PV_Retro$groupe.patient)
##
## F test to compare two variances
##
## data: PV_Retro$nbr.de.PA by PV_Retro$groupe.patient
## F = 1.1093, num df = 17, denom df = 60, p-value = 0.7337
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.5525708 2.6403594
## sample estimates:
## ratio of variances
## 1.109346
l’egalité des variances n’est pas rejetée
wilcox.test(PV_Retro$nbr.de.PA ~ PV_Retro$groupe.patient)
##
## Wilcoxon rank sum test with continuity correction
##
## data: PV_Retro$nbr.de.PA by PV_Retro$groupe.patient
## W = 437, p-value = 0.188
## alternative hypothesis: true location shift is not equal to 0
L’hypothèse nulle d’égalité des moyennes de nombre de PA n’est pas rejetée car la p-value est > 0.05. Ainsi, rien ne permet d’affirmer que les médianes d’ages des du groupe PV et du groupe Retro sont différentes. Pas de difference
library(car)
ggplot(PV_Retro, aes(y=groupe.patient, x=durée.des.symptomes.avant.drainage_jour, colour=durée.des.symptomes.avant.drainage_jour, fill=durée.des.symptomes.avant.drainage_jour))+
geom_jitter(height=0, width=0.25)+
geom_boxplot(alpha=0.5,notch=TRUE)
## Warning: Removed 25 rows containing non-finite values (`stat_boxplot()`).
## Warning: The following aesthetics were dropped during statistical transformation:
## colour, fill
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
## Warning: Removed 25 rows containing missing values (`geom_point()`).
## Notch went outside hinges
## ℹ Do you want `notch = FALSE`?
Le tableur ci-dessous ontre le tableau de comparaison entre les deux groupes PV Vs Retro
groupwiseMean(durée.des.symptomes.avant.drainage_jour~groupe.patient,data=PV_Retro, conf=0.95, digits=5)
## groupe.patient n Mean Conf.level Trad.lower Trad.upper
## 1 PV 41 NA 0.95 NA NA
## 2 Retro 121 NA 0.95 NA NA
Le test ci-dessous nous permet de verifier les conditions de validité du test de student:
shapiro.test(PV_Retro$durée.des.symptomes.avant.drainage_jour[PV_Retro$groupe.patient=="PV"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$durée.des.symptomes.avant.drainage_jour[PV_Retro$groupe.patient == "PV"]
## W = 0.39437, p-value = 3.377e-11
==> la normalité n’est pas accepté dans le groupe PV
shapiro.test(PV_Retro$durée.des.symptomes.avant.drainage_jour[PV_Retro$groupe.patient=="Retro"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$durée.des.symptomes.avant.drainage_jour[PV_Retro$groupe.patient == "Retro"]
## W = 0.3401, p-value < 2.2e-16
==> la normalité n’est pas accepté dans le groupe Retro
La normalité étant rejetée dans les deux groupes, nous devons employer un test de de Wilcoxon
var.test(PV_Retro$durée.des.symptomes.avant.drainage_jour ~ PV_Retro$groupe.patient)
##
## F test to compare two variances
##
## data: PV_Retro$durée.des.symptomes.avant.drainage_jour by PV_Retro$groupe.patient
## F = 1.4935, num df = 36, denom df = 99, p-value = 0.1244
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.895761 2.671001
## sample estimates:
## ratio of variances
## 1.493512
l’egalité des variances n’est pas rejetée
wilcox.test(PV_Retro$durée.des.symptomes.avant.drainage_jour ~ PV_Retro$groupe.patient)
##
## Wilcoxon rank sum test with continuity correction
##
## data: PV_Retro$durée.des.symptomes.avant.drainage_jour by PV_Retro$groupe.patient
## W = 2047, p-value = 0.1636
## alternative hypothesis: true location shift is not equal to 0
L’hypothèse nulle d’égalité des medianes de la duree des symptomes avant drainage n’est pas rejetée car la p-value est > 0.05. Ainsi, rien ne permet d’affirmer que les médianes d’ages des du groupe PV et du groupe Retro sont différentes. Pas de difference
library(car)
ggplot(PV_Retro, aes(y=groupe.patient, x=nombre.de.jours.de.drainage, colour=nombre.de.jours.de.drainage, fill=nombre.de.jours.de.drainage))+
geom_jitter(height=0, width=0.25)+
geom_boxplot(alpha=0.5,notch=TRUE)
## Warning: The following aesthetics were dropped during statistical transformation:
## colour, fill
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
Le tableur ci-dessous ontre le tableau de comparaison entre les deux groupes PV Vs Retro
groupwiseMean(nombre.de.jours.de.drainage~groupe.patient,data=PV_Retro, conf=0.95, digits=5)
## groupe.patient n Mean Conf.level Trad.lower Trad.upper
## 1 PV 41 6.3171 0.95 5.4065 7.2276
## 2 Retro 121 3.6694 0.95 3.3160 4.0229
Le test ci-dessous nous permet de verifier les conditions de validité du test de student:
shapiro.test(PV_Retro$nombre.de.jours.de.drainage[PV_Retro$groupe.patient=="PV"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$nombre.de.jours.de.drainage[PV_Retro$groupe.patient == "PV"]
## W = 0.94812, p-value = 0.06011
==> la normalité n’est pas accepté dans le groupe PV
shapiro.test(PV_Retro$nombre.de.jours.de.drainage[PV_Retro$groupe.patient=="Retro"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$nombre.de.jours.de.drainage[PV_Retro$groupe.patient == "Retro"]
## W = 0.87295, p-value = 9.16e-09
==> la normalité n’est pas accepté dans le groupe Retro
La normalité étant rejetée dans les deux groupes, nous devons employer un test de de Wilcoxon
var.test(PV_Retro$nombre.de.jours.de.drainage~ PV_Retro$groupe.patient)
##
## F test to compare two variances
##
## data: PV_Retro$nombre.de.jours.de.drainage by PV_Retro$groupe.patient
## F = 2.1579, num df = 40, denom df = 120, p-value = 0.001472
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 1.336877 3.720691
## sample estimates:
## ratio of variances
## 2.157917
l’egalité des variances est rejetée
wilcox.test(PV_Retro$nombre.de.jours.de.drainage ~ PV_Retro$groupe.patient)
##
## Wilcoxon rank sum test with continuity correction
##
## data: PV_Retro$nombre.de.jours.de.drainage by PV_Retro$groupe.patient
## W = 3864, p-value = 6.314e-08
## alternative hypothesis: true location shift is not equal to 0
L’hypothèse nulle d’égalité du nombre.de.jours.de.drainage est rejetée car la p-value est < 0.05. Ainsi,lenombre de.jours.de.drainage du groupe PV et du groupe Retro sont différentes.
Difference significative +++ entre le groupe Pv et le groupe Retro
##comparaison nombre de CSsur 1 an pour psp
library(car)
ggplot(PV_Retro, aes(y=groupe.patient, x=NOMBRE.DE..CS_SUR.1.AN_.pour.psp, colour=NOMBRE.DE..CS_SUR.1.AN_.pour.psp, fill=NOMBRE.DE..CS_SUR.1.AN_.pour.psp))+
geom_jitter(height=0, width=0.25)+
geom_boxplot(alpha=0.5,notch=TRUE)
## Warning: Removed 1 rows containing non-finite values (`stat_boxplot()`).
## Warning: The following aesthetics were dropped during statistical transformation:
## colour, fill
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
## Warning: Removed 1 rows containing missing values (`geom_point()`).
## Notch went outside hinges
## ℹ Do you want `notch = FALSE`?
Le tableur ci-dessous ontre le tableau de comparaison entre les deux groupes PV Vs Retro
groupwiseMean(NOMBRE.DE..CS_SUR.1.AN_.pour.psp~groupe.patient,data=PV_Retro, conf=0.95, digits=5)
## groupe.patient n Mean Conf.level Trad.lower Trad.upper
## 1 PV 41 3.3659 0.95 2.9153 3.8164
## 2 Retro 121 NA 0.95 NA NA
Le test ci-dessous nous permet de verifier les conditions de validité du test de student:
shapiro.test(PV_Retro$NOMBRE.DE..CS_SUR.1.AN_.pour.psp[PV_Retro$groupe.patient=="PV"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$NOMBRE.DE..CS_SUR.1.AN_.pour.psp[PV_Retro$groupe.patient == "PV"]
## W = 0.93598, p-value = 0.02292
==> la normalité n’est pas accepté dans le groupe PV
shapiro.test(PV_Retro$NOMBRE.DE..CS_SUR.1.AN_.pour.psp[PV_Retro$groupe.patient=="Retro"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$NOMBRE.DE..CS_SUR.1.AN_.pour.psp[PV_Retro$groupe.patient == "Retro"]
## W = 0.83654, p-value = 3.341e-10
==> la normalité n’est pas accepté dans le groupe Retro
La normalité étant rejetée dans les deux groupes, nous devons employer un test de de Wilcoxon
var.test(PV_Retro$NOMBRE.DE..CS_SUR.1.AN_.pour.psp ~ PV_Retro$groupe.patient)
##
## F test to compare two variances
##
## data: PV_Retro$NOMBRE.DE..CS_SUR.1.AN_.pour.psp by PV_Retro$groupe.patient
## F = 2.8667, num df = 40, denom df = 119, p-value = 1.102e-05
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 1.774783 4.944756
## sample estimates:
## ratio of variances
## 2.866698
l’egalité des variances est rejetée
wilcox.test(PV_Retro$NOMBRE.DE..CS_SUR.1.AN_.pour.psp ~ PV_Retro$groupe.patient)
##
## Wilcoxon rank sum test with continuity correction
##
## data: PV_Retro$NOMBRE.DE..CS_SUR.1.AN_.pour.psp by PV_Retro$groupe.patient
## W = 4413, p-value = 1.737e-15
## alternative hypothesis: true location shift is not equal to 0
L’hypothèse nulle d’égalité des moyennes des nombres de Cs sur 1 an est rejetée car la p-value est < 0.05. Ainsi, la difference de nombre de consultation sur 1 an pourpsp est significativement differente
library(car)
ggplot(PV_Retro, aes(y=groupe.patient, x=NOMBRE_DE_RT_SUR_1_AN, colour=NOMBRE_DE_RT_SUR_1_AN, fill=NOMBRE_DE_RT_SUR_1_AN))+
geom_jitter(height=0, width=0.25)+
geom_boxplot(alpha=0.5,notch=TRUE)
## Warning: Removed 1 rows containing non-finite values (`stat_boxplot()`).
## Warning: The following aesthetics were dropped during statistical transformation:
## colour, fill
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
## Warning: Removed 1 rows containing missing values (`geom_point()`).
Le tableur ci-dessous ontre le tableau de comparaison entre les deux groupes PV Vs Retro
groupwiseMean(NOMBRE_DE_RT_SUR_1_AN ~ groupe.patient,data=PV_Retro, conf=0.95, digits=5)
## groupe.patient n Mean Conf.level Trad.lower Trad.upper
## 1 PV 41 NA 0.95 NA NA
## 2 Retro 121 11.942 0.95 10.78 13.105
Le test ci-dessous nous permet de verifier les conditions de validité du test de student:
shapiro.test(PV_Retro$NOMBRE_DE_RT_SUR_1_AN[PV_Retro$groupe.patient=="PV"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$NOMBRE_DE_RT_SUR_1_AN[PV_Retro$groupe.patient == "PV"]
## W = 0.8966, p-value = 0.001524
==> la normalité n’est pas accepté dans le groupe PV
shapiro.test(PV_Retro$NOMBRE_DE_RT_SUR_1_AN[PV_Retro$groupe.patient=="Retro"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$NOMBRE_DE_RT_SUR_1_AN[PV_Retro$groupe.patient == "Retro"]
## W = 0.88256, p-value = 2.507e-08
==> la normalité n’est pas accepté dans le groupe Retro
La normalité étant rejetée dans les deux groupes, nous devons employer un test de de Wilcoxon
var.test(PV_Retro$NOMBRE_DE_RT_SUR_1_AN ~ PV_Retro$groupe.patient)
##
## F test to compare two variances
##
## data: PV_Retro$NOMBRE_DE_RT_SUR_1_AN by PV_Retro$groupe.patient
## F = 0.55795, num df = 39, denom df = 120, p-value = 0.03833
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.3443624 0.9681201
## sample estimates:
## ratio of variances
## 0.5579488
l’egalité des variances n’est pas rejetée
wilcox.test(PV_Retro$NOMBRE_DE_RT_SUR_1_AN ~ PV_Retro$groupe.patient)
##
## Wilcoxon rank sum test with continuity correction
##
## data: PV_Retro$NOMBRE_DE_RT_SUR_1_AN by PV_Retro$groupe.patient
## W = 1804.5, p-value = 0.0158
## alternative hypothesis: true location shift is not equal to 0
L’hypothèse nulle d’égalité des moyennes de nombre de RT est rejetée car la p-value est < 0.05. Ainsi, la difference entre le nombre de Rt dans le groupe Retro est significativement different de celui dans le groupe PV
library(car)
ggplot(PV_Retro, aes(y=groupe.patient, x=duree_arret_travail_jour, colour=duree_arret_travail_jour, fill=duree_arret_travail_jour))+
geom_jitter(height=0, width=0.25)+
geom_boxplot(alpha=0.5,notch=TRUE)
## Warning: Removed 94 rows containing non-finite values (`stat_boxplot()`).
## Warning: The following aesthetics were dropped during statistical transformation:
## colour, fill
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
## Warning: Removed 94 rows containing missing values (`geom_point()`).
Le tableur ci-dessous ontre le tableau de comparaison entre les deux groupes PV Vs Retro
groupwiseMean(duree_arret_travail_jour~groupe.patient,data=PV_Retro, conf=0.95, digits=5)
## groupe.patient n Mean Conf.level Trad.lower Trad.upper
## 1 PV 41 NA 0.95 NA NA
## 2 Retro 121 NA 0.95 NA NA
Le test ci-dessous nous permet de verifier les conditions de validité du test de student:
shapiro.test(PV_Retro$duree_arret_travail_jour[PV_Retro$groupe.patient=="PV"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$duree_arret_travail_jour[PV_Retro$groupe.patient == "PV"]
## W = 0.90577, p-value = 0.03885
==> la normalité n’est pas accepté dans le groupe PV
shapiro.test(PV_Retro$duree_arret_travail_jour[PV_Retro$groupe.patient=="Retro"])
##
## Shapiro-Wilk normality test
##
## data: PV_Retro$duree_arret_travail_jour[PV_Retro$groupe.patient == "Retro"]
## W = 0.90357, p-value = 0.001072
==> la normalité n’est pas accepté dans le groupe Retro
La normalité étant rejetée dans les deux groupes, nous devons employer un test de de Wilcoxon
var.test(PV_Retro$duree_arret_travail_jour ~ PV_Retro$groupe.patient)
##
## F test to compare two variances
##
## data: PV_Retro$duree_arret_travail_jour by PV_Retro$groupe.patient
## F = 0.91549, num df = 21, denom df = 45, p-value = 0.8512
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.455711 2.037250
## sample estimates:
## ratio of variances
## 0.9154943
l’egalité des variances n’est pas rejetée
wilcox.test(PV_Retro$duree_arret_travail_jour ~ PV_Retro$groupe.patient)
## Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): impossible
## de calculer la p-value exacte avec des ex-aequos
##
## Wilcoxon rank sum test with continuity correction
##
## data: PV_Retro$duree_arret_travail_jour by PV_Retro$groupe.patient
## W = 487, p-value = 0.808
## alternative hypothesis: true location shift is not equal to 0
L’hypothèse nulle d’égalité des moyennes d’arret de travail n’est pas rejetée car la p-value est > 0.05. Ainsi, rien ne permet d’affirmer que les médianes d’arrets de travails du groupe PV et du groupe Retro sont différentes. Pas de difference
PV_Retro_qualitatif <- read.csv2("C:/Users/mallah.s/Desktop/Stats et Theses/Ambuthorax/PV_Retro_qualitatif.csv", stringsAsFactors=TRUE)
t_sexe<-table(PV_Retro_qualitatif$groupe.patient, PV_Retro_qualitatif$SEXE ,dnn = c( "groupe","sexe"))
t_sexe
## sexe
## groupe Féminin Masculin
## PV 9 32
## Retro 16 105
prop.table(t_sexe,1)
## sexe
## groupe Féminin Masculin
## PV 0.2195122 0.7804878
## Retro 0.1322314 0.8677686
Il sagit donc de comparer 78.04% à 86.67% C’est une situation dans laquelle nous pouvons employer le test du Chi2. Nous commençons par vérifier les conditions d’application.
chisq.test(t_sexe)$expected
## sexe
## groupe Féminin Masculin
## PV 6.32716 34.67284
## Retro 18.67284 102.32716
chisq.test(t_sexe, correct=FALSE)
##
## Pearson's Chi-squared test
##
## data: t_sexe
## X-squared = 1.7876, df = 1, p-value = 0.1812
La pvalue est >0.05, l’hypothèse nulle d’égalité des proportions n’est pas rejetée. Ainsi, rien ne nous permet d’affirmer que le porcentage de sexe feminin ou masculin est plus elevé dans un groupe ou l’ autre
t_tabac_oui<-table(PV_Retro_qualitatif$groupe.patient, PV_Retro_qualitatif$Tabac_oui ,dnn = c( "groupe","tabac_Oui"))
t_tabac_oui
## tabac_Oui
## groupe Non Oui
## PV 4 9 28
## Retro 5 25 91
t_tabac_Non<-table(PV_Retro_qualitatif$groupe.patient, PV_Retro_qualitatif$Tabac_non ,dnn = c( "groupe","tabac_Non"))
t_tabac_Non
## tabac_Non
## groupe Non Oui
## PV 4 30 7
## Retro 5 100 16
t_tabac_sevre<-table(PV_Retro_qualitatif$groupe.patient, PV_Retro_qualitatif$Tabac_sevre ,dnn = c( "groupe","tabac_sevre"))
t_tabac_sevre
## tabac_sevre
## groupe Non Oui
## PV 4 35 2
## Retro 5 107 9
prop.table(t_tabac_oui,1)
## tabac_Oui
## groupe Non Oui
## PV 0.09756098 0.21951220 0.68292683
## Retro 0.04132231 0.20661157 0.75206612
Il sagit donc de comparer 68.29% à 75.20% C’est une situation dans laquelle nous pouvons employer le test du Chi2. Nous commençons par vérifier les conditions d’application.
chisq.test(t_tabac_oui)$expected
## Warning in chisq.test(t_tabac_oui): L’approximation du Chi-2 est peut-être
## incorrecte
## tabac_Oui
## groupe Non Oui
## PV 2.277778 8.604938 30.11728
## Retro 6.722222 25.395062 88.88272
chisq.test(t_tabac_oui, correct=FALSE)
## Warning in chisq.test(t_tabac_oui, correct = FALSE): L’approximation du Chi-2
## est peut-être incorrecte
##
## Pearson's Chi-squared test
##
## data: t_tabac_oui
## X-squared = 1.967, df = 2, p-value = 0.374
t_cannabis<-table(PV_Retro$groupe.patient, PV_Retro$cannabis. ,dnn = c( "groupe","cannabis"))
t_cannabis
## cannabis
## groupe Non Oui sevré
## PV 8 11 16 6
## Retro 30 30 55 6
prop.table(t_cannabis,1)
## cannabis
## groupe Non Oui sevré
## PV 0.19512195 0.26829268 0.39024390 0.14634146
## Retro 0.24793388 0.24793388 0.45454545 0.04958678
Il sagit donc de comparer C’est une situation dans laquelle nous pouvons employer le test du Chi2. Nous commençons par vérifier les conditions d’application.
fisher.test(t_cannabis)
##
## Fisher's Exact Test for Count Data
##
## data: t_cannabis
## p-value = 0.2333
## alternative hypothesis: two.sided