El primer ejercicio nos dice que, en 132 dias anotados, durante dos dias se sobrepasó la medida de 120 estipulada por EEUU. Nos preguntan que si esos dos días en el que se superan las concentraciones, es superior a 0,05 al 95% de confiaza.

Para ello usamos el comando “binom.test” con el numero de veces sobrepasados, el numero de didas totales y la proporción esperada.

binom.test(2,132,p=0.05, alternative = "less")
## 
##  Exact binomial test
## 
## data:  2 and 132
## number of successes = 2, number of trials = 132, p-value = 0.03658
## alternative hypothesis: true probability of success is less than 0.05
## 95 percent confidence interval:
##  0.00000000 0.04692521
## sample estimates:
## probability of success 
##             0.01515152

vemos como el p-valor es 0,036, por lo que tnemos que aceptar la hipótesis nula. El numero de días es menor a 0,05.

En el segundo ejercicio tenemos que leer la tabla en cuestión:

entrenamiento <-read.table("trcData.csv",header = TRUE, sep = ";")
head(entrenamiento)
##    Edad TRCAntes TRCDesp
## 1 40-49    12.24   11.81
## 2 40-49    12.45   11.50
## 3 40-49    11.04   10.55
## 4 40-49    11.22   10.33
## 5 40-49    11.58   10.63
## 6 40-49     8.34    8.35

EN LA PRIMERA PREGUNTA: nos preguntan si hay diferencia en la TRC (media) antes de realizar el entrenamiento según la edad; lo que nos pide es que usemos la columna “TRCantes” y veamos su media entre los dos grupos de edades disponibles.

Por tanto, hay que comprobar si se cumplen la hipótesis de normalidad para los dos grupos.

primero hacemos para el grupo de edad 40-49 con graficos Q-Q

qqnorm( entrenamiento$TRCAntes[ entrenamiento$Edad == "40-49" ] )
qqline( entrenamiento$TRCAntes[ entrenamiento$Edad == "40-49" ] )

### y el shapiro.test (menos de 50 observaciones)

shapiro.test( entrenamiento$TRCAntes[ entrenamiento$Edad == "40-49" ] )
## 
##  Shapiro-Wilk normality test
## 
## data:  entrenamiento$TRCAntes[entrenamiento$Edad == "40-49"]
## W = 0.76, p-value = 0.002372

el p-value es 0,0023 por tanto se rechaza la hipótesis nula de normalidad

Ahora lo hacemos igual para los grupod e edad 50-59

qqnorm( entrenamiento$TRCAntes[ entrenamiento$Edad == "50-59" ] )
qqline( entrenamiento$TRCAntes[ entrenamiento$Edad == "50-59" ] )

shapiro.test( entrenamiento$TRCAntes[ entrenamiento$Edad == "50-59" ] )
## 
##  Shapiro-Wilk normality test
## 
## data:  entrenamiento$TRCAntes[entrenamiento$Edad == "50-59"]
## W = 0.86474, p-value = 0.1079

En cambio, según indica el p-value (0,1), se acepta la hipótesis nula. Es decir, hay normalidad.

Al haber un grupo con normalidad y otro sin, debemos de hacer la homocedasticidad pra ver el test que le aplicamos. Al tener el duda la normalidad (ha salido en un grupo “si” y otro grupo “no”), le aplicamos un test en el que la normalidad no hace falta.

fligner.test(entrenamiento$TRCAntes,entrenamiento$Edad)
## 
##  Fligner-Killeen test of homogeneity of variances
## 
## data:  entrenamiento$TRCAntes and entrenamiento$Edad
## Fligner-Killeen:med chi-squared = 4.8035, df = 1, p-value = 0.0284

Sale significativo (p-value=0,028), de modo que no suponemos la homocedasticidad

Por ultimo, le hacemos el contraste de hipótesis con el t-test y con el de wilcox que no necesita que haya normalidad

t.test(entrenamiento$TRCAntes[ entrenamiento$Edad == "40-49" ],
       entrenamiento$TRCAntes[ entrenamiento$Edad == "50-59" ],
       alternative = "two.sided")
## 
##  Welch Two Sample t-test
## 
## data:  entrenamiento$TRCAntes[entrenamiento$Edad == "40-49"] and entrenamiento$TRCAntes[entrenamiento$Edad == "50-59"]
## t = -2.1545, df = 10.048, p-value = 0.0565
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -4.78044604  0.07873664
## sample estimates:
## mean of x mean of y 
##  11.10692  13.45778
wilcox.test( TRCAntes ~ Edad, data = entrenamiento)
## Warning in wilcox.test.default(x = c(12.24, 12.45, 11.04, 11.22, 11.58, :
## cannot compute exact p-value with ties
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  TRCAntes by Edad
## W = 36, p-value = 0.1417
## alternative hypothesis: true location shift is not equal to 0

Podemos observar que los p-value en ambos comandos utilizados varían de 0,056 hasta el 0,1417 del wilcox, de modo que se acepta la hipótesis nula: NO SE HAN ENCONTRADO DIFERENCIAS EN LAS MEDIAS SEGUN LA CLASE.

EN LA SEGUNDA PREGUNTA: nos dicen si la media de TRCdesp es 10,2, de modo que comprobamos la normalidad y el shapiro test igual que antes.

qqnorm( entrenamiento$TRCDesp )
qqline( entrenamiento$TRCDesp )

shapiro.test(entrenamiento$TRCDesp)
## 
##  Shapiro-Wilk normality test
## 
## data:  entrenamiento$TRCDesp
## W = 0.80948, p-value = 0.0007068

Es significativo (p-value=0,00070) por lo que se rechaza la normalidad

Por ultimo hacemos el contraste.Usamos t-test.

t.test (entrenamiento$TRCDesp,mu=10.2,alternative="two.sided")
## 
##  One Sample t-test
## 
## data:  entrenamiento$TRCDesp
## t = 2.2943, df = 21, p-value = 0.03218
## alternative hypothesis: true mean is not equal to 10.2
## 95 percent confidence interval:
##  10.31124 12.46604
## sample estimates:
## mean of x 
##  11.38864

obtenemos un p-value de 0,03218 por lo que, al ser menor de 0,05 rechazamos la hipótesis nula y decimos que la media NO es 10,2.

EN LA TERCERA Y ULTIMA PREGUNTA DEL EJERCICIO: nos dicen que planteemos un contraste para ver si mejora la tasa de recuperación cardíaca (media) después de realizar entrenamiento físico.

Lo podríamos abordar comparando las tasas de recuperación cardiaca antes y despues del ajercicio suponiendo que la hipotesis nula es que no varía.

Para ello,hay que comprobar si se cumplen la hipótesis de normalidad para los dos grupos.

shapiro.test(entrenamiento$TRCAntes)
## 
##  Shapiro-Wilk normality test
## 
## data:  entrenamiento$TRCAntes
## W = 0.83358, p-value = 0.001764

El p-value que obtenemos es 0,0017 para el TRCAntes, se rechaza la hipotesis nula

shapiro.test(entrenamiento$TRCDesp)
## 
##  Shapiro-Wilk normality test
## 
## data:  entrenamiento$TRCDesp
## W = 0.80948, p-value = 0.0007068

El p-value que obtenemos es 0,00070 para el TRCDesp, se rechaza la hipotesis nula

Comprovamos HOV

fligner.test(entrenamiento$TRCAntes,entrenamiento$TRCDesp)
## 
##  Fligner-Killeen test of homogeneity of variances
## 
## data:  entrenamiento$TRCAntes and entrenamiento$TRCDesp
## Fligner-Killeen:med chi-squared = NaN, df = 21, p-value = NA

Por ultimo, hacemos el t test y el wilcox

t.test( entrenamiento$TRCAntes , 
        entrenamiento$TRCDesp, 
        alternative = "less",
        paired = TRUE )
## 
##  Paired t-test
## 
## data:  entrenamiento$TRCAntes and entrenamiento$TRCDesp
## t = 6.287, df = 21, p-value = 1
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##       -Inf 0.8661165
## sample estimates:
## mean of the differences 
##                    0.68
wilcox.test(entrenamiento$TRCAntes, entrenamiento$TRCDesp, paired=TRUE,alternative = "less")
## Warning in wilcox.test.default(entrenamiento$TRCAntes, entrenamiento
## $TRCDesp, : cannot compute exact p-value with ties
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  entrenamiento$TRCAntes and entrenamiento$TRCDesp
## V = 247, p-value = 1
## alternative hypothesis: true location shift is less than 0

Esto nos permite suponer que no hay mejoria si hacemos caso al t-test y si que hay si hacemos caso al de wilcox. Al no haber normalidad y el test de wilcox no necesitarla, haremos caso a este ultimo. SI MEJORA LA TASA DE RECUPERACION CARDIACA.