Queremos evaluar si una vitamina especial ayuda a
que las plantas crezcan más rápido.
Para esto simularemos datos de crecimiento (en cm) en dos grupos:
control y experimental.
set.seed(123)
# Grupo control: crecimiento normal con media = 3.5 cm y sd = 1
control <- rnorm(30, mean = 3.5, sd = 1)
# Grupo experimental: crecimiento normal con media = 4.2 cm y sd = 1.1
experimental <- rnorm(30, mean = 4.2, sd = 1.1)
# Revisemos estadísticos descriptivos
mean(control); sd(control)
## [1] 3.452896
## [1] 0.9810307
mean(experimental); sd(experimental)
## [1] 4.396172
## [1] 0.9186407
Explica los resultados de las medidas
En las medidas que se tomaron se encontro que la media del grupo de control se encuentra en 3.45 cm, con una desviacion estandar de 0.98 cm, mientras que la media del grupo experimental, ronda los 4.39 cm, con una desviacion estandar de 0.91. Esto demuestra que las vitaminas afectan de cierto modo el crecimiento de las plantas, lo que podemos observar en las medias de los grupos, ya que en la del grupo de control en donde no se le dieron vitaminas a las plantas, estas crecieron en promedio hasta 3.45, por otro lado, el grupo experimental al que se les brindo la vitamina tuvo un mayor crecimiento de hasta 4.3 cm en el mismo periodo, a su vez, la desviacion estandar del grupo de control es ligeramenre mayor, lo que indica mayor dispersion en el grupo de control que en el experimental.
# Tomamos muchas muestras de tamaño 10 del grupo experimental
n <- 50
B <- 1000 # número de réplicas
medias <- replicate(B, mean(sample(experimental, n, replace = TRUE)))
hist(medias, breaks = 30, main = "Distribución muestral de la media",
xlab = "Media de las muestras", col = "lightblue")
# Pregunta: ¿Qué pasa si cambiamos n = 10 por n = 50?
# Calcular IC del 95% para la media del grupo experimental
t.test(experimental, conf.level = 0.95)
##
## One Sample t-test
##
## data: experimental
## t = 26.211, df = 29, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 4.053146 4.739198
## sample estimates:
## mean of x
## 4.396172
Interpreta el resultado: ¿estás 95% seguro de que la media poblacional está en qué rango?
En este caso, podemos determinar con un nivel de confianza del 95% que la media poblacional se encuentra en un rango comprendido de entre 4.05 cm y 4.73 cm. La —
Hipótesis a probar:
t.test(experimental, mu = 3.5, alternative = "two.sided")
##
## One Sample t-test
##
## data: experimental
## t = 5.3433, df = 29, p-value = 9.772e-06
## alternative hypothesis: true mean is not equal to 3.5
## 95 percent confidence interval:
## 4.053146 4.739198
## sample estimates:
## mean of x
## 4.396172
👉 Pregunta: ¿cuál sería más grave en este caso?
# p-valor
resultado <- t.test(experimental, mu = 3.5)
resultado$p.value
## [1] 9.772454e-06
Si p < 0.05 rechazamos H0. ¿Qué significa esto?
¿Un resultado “significativo” siempre es relevante en la vida real?
Esto significa que se encontro que la tasa de error tipo 1 es mas pequeña que los resultados de aplha, lo que demuestra que existe una significancia en los efectos comprendidos y por lo tanto, no se dieron debido al azar.
Un resultado significativo no es siempre relevante en la vida real, debido a que relevancia estadistica no necesariamente se traduce en relevancia a la hora de realizar una medida ante cierto fenomeno estudiado o la necesidad de iniciar un proceso de accion, debido a que esto ultimo depende de muchos otros factores. ```