TAREA 1: MÉTODOS DE CONTRASTE DE HIPÓTESIS Y DISEÑO DE EXPERIMENTOS.

Ejercicio 1: Se obtuvieron durante 132 días las concentraciones máximas de ozono (en partes por \(10^9\)) en una determinada zona de Nueva York. Estados Unidos fija como requirimiento un nivel máximo de 120 de ozono. De los 132 días, 2 días presentaron niveles de ozono por encima de 120. Contrasta si la proporción de días con nivel de ozono mayor que el permitido es menor o igual que 0.05 y calcula un intervalo de confianza al 95%.

H0: p es mayor a 0.05. H1: p es menor o igual a 0.05

binom.test(2, 132, 0.05 , alternative= "l")
## 
##  Exact binomial test
## 
## data:  2 and 132
## number of successes = 2, number of trials = 132, p-value = 0.03658
## alternative hypothesis: true probability of success is less than 0.05
## 95 percent confidence interval:
##  0.00000000 0.04692521
## sample estimates:
## probability of success 
##             0.01515152
## El p-valor es de 0.035, (<0.05), por lo que rechazamos la hipótesis nula por lo que podemos considerar que la proporción de días con nivel de ozono mayor que el permitido es menor o igual que 0.05.

Ejercicio 2: A unos pacientes se les ha administrado unos medicamentos para ver si son efectivos en la disminución de ciertas moléculas en sangre. Se han tomado medidas al inicio del estudio, a los 3 meses y a los 6 meses. Los valores obtenidos están recogidos en el fichero medicamentos.csv. Se pide:

Cargamos el fichero con los datos y ejecutamos algunos comandos para conocer los datos del fichero:

medic <- read.table (file= "medicamentos.csv", header= T, sep= ";") 
head (medic)
##   ID Sex Group    Month0    Month3   Month6
## 1  1   F     P 12.741917 10.302912 8.302369
## 2  2   F     P  8.870604  8.831782 7.822960
## 3  3   F     P 10.726257 10.737613 9.031419
## 4  4   F     P 11.265725 10.589309 9.327378
## 5  5   F     P 10.808537  9.441481 9.693284
## 6  6   F     P  9.787751  7.327527 9.513506
str (medic)
## 'data.frame':    96 obs. of  6 variables:
##  $ ID    : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ Sex   : Factor w/ 2 levels "F","M": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Group : Factor w/ 2 levels "M1","P": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Month0: num  12.74 8.87 10.73 11.27 10.81 ...
##  $ Month3: num  10.3 8.83 10.74 10.59 9.44 ...
##  $ Month6: num  8.3 7.82 9.03 9.33 9.69 ...

2.1 Contrastar, con nivel de significación \(\alpha = 0.05\), si la media de los valores en el mes inicial (Month0) es 10.

H0: media mes inicial es 10; H1: media del mes inicial es distinta de 10.

# Se realiza el test para una muestra, comprobando previamente el supuesto de normalidad.

## H0 si hay normalidad; H1 no hay normalidad
qqnorm( medic$Month0);qqline( medic$Month0)

shapiro.test( medic$Month0) 
## 
##  Shapiro-Wilk normality test
## 
## data:  medic$Month0
## W = 0.98767, p-value = 0.5142
## El p-valor de la prueba de normalidad (Shapiro-Wilk) es 0.51 (>0.05), por lo que no podemos rechazar la hipótesis nula, que afirma que la variable "Month0" sigue una distribución normal.

## Hacemos la prueba t para una muestra:
t.test (x= medic$Month0, mu= 10, alternative = "t")
## 
##  One Sample t-test
## 
## data:  medic$Month0
## t = 0.63124, df = 95, p-value = 0.5294
## alternative hypothesis: true mean is not equal to 10
## 95 percent confidence interval:
##   9.724152 10.533047
## sample estimates:
## mean of x 
##   10.1286
## p= 0.53 (>0.05), por lo que no podemos rechazar la hipótesis que afirma que la media en el mes inicial sea igual a 0.

2.2 ¿Debemos aceptar o rechazar la diferencia de la media del mes inicial (Month0) según el sexo (Sex), para \(\alpha = 0.05\)?

H0: las medias de hombres y mujeres son iguales en el mes inicial; H1: existen diferencias estadísticamente significativas en las medias del mes inicial entre hombres y mujeres.

# Se realiza la prueba t para muestras independientes, comprobando previamente los supuestos de normalidad y homocedasticidad para ambos grupos.

## H0 si hay normalidad; H1 no hay normalidad
iniF <- medic$Month0 [medic$Sex== "F"]
iniM <- medic$Month0[medic$Sex == "M"]

qqnorm (iniF); qqline (iniF)

shapiro.test(iniF)
## 
##  Shapiro-Wilk normality test
## 
## data:  iniF
## W = 0.97567, p-value = 0.4135
## En el grupo de las mujeres p> 0.05, por lo que aceptamos la normalidad de la distribucion.

qqnorm (iniM); qqline (iniM)

shapiro.test(iniM)
## 
##  Shapiro-Wilk normality test
## 
## data:  iniM
## W = 0.98733, p-value = 0.8789
## En el caso de los hombres, también aceptamos la distribución normal de la variable "Month0"

## H0: si hay homocedasticidad; H1: no hay homocedasticidad.
library (car)
## Loading required package: carData
leveneTest (medic$Month0 ~ medic$Sex)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1  0.2236 0.6374
##       94
## p-valor> 0.05, por lo que no podemos rechazar la hipótesis nula de que si existe homocedasticidad.

## Hacemos la prueba t para dos muestras independientes:
t.test (medic$Month0 ~ medic$Sex, var.equal = T )
## 
##  Two Sample t-test
## 
## data:  medic$Month0 by medic$Sex
## t = 0.952, df = 94, p-value = 0.3435
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.4213205  1.1974887
## sample estimates:
## mean in group F mean in group M 
##       10.322642        9.934557
## p= 0.34 (>0.05), por lo que no podemos rechazar la hipótesis nula que explica que no existen diferencias estadísticamente significativas en las medias de "Month0" entre hombres y mujeres.

2.3 Los investigadores afirman que hay diferencia entre los valores tomados en el mes inicial (Month0) y en el tercer mes (Month3). ¿Tienen razón?

H0: las medias de los dos meses son iguales; H1: existen diferencias estadísticamente significativas en las medias del mes inicial y del tercer mes.

# Se realiza la prueba t para muestras dependientes, comprobando previamente el supuesto de normalidad en las medidas tomadas en los diferentes meses.

## H0 si hay normalidad; H1 no hay normalidad
qqnorm (medic$Month0); qqline (medic$Month0)

shapiro.test(medic$Month0)
## 
##  Shapiro-Wilk normality test
## 
## data:  medic$Month0
## W = 0.98767, p-value = 0.5142
qqnorm (medic$Month3); qqline (medic$Month3)

shapiro.test(medic$Month3)
## 
##  Shapiro-Wilk normality test
## 
## data:  medic$Month3
## W = 0.9877, p-value = 0.5161
## Ambas variables siguen una distribución normal (p= 0.51)

## Aplicamos el test t para muestras dependientes:
t.test (medic$Month0, medic$Month3, paired = TRUE, alternative = "t")
## 
##  Paired t-test
## 
## data:  medic$Month0 and medic$Month3
## t = 5.7578, df = 95, p-value = 1.043e-07
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  1.314517 2.698015
## sample estimates:
## mean of the differences 
##                2.006266
## El p-valor es <0.05, por lo que rechazamos la hipótesis nula y afirmando que existen diferencias estadísticamente significativas entre los valores tomados en el mes inicial y en el tercer mes.