Contexto

Queremos evaluar si una vitamina especial ayuda a que las plantas crezcan más rápido.
Para esto simularemos datos de crecimiento (en cm) en dos grupos: control y experimental.


1. Simulación de datos

set.seed(123)

# Grupo control: crecimiento normal con media = 3.5 cm y sd = 1
control <- rnorm(30, mean = 3.5, sd = 1)

# Grupo experimental: crecimiento normal con media = 4.2 cm y sd = 1.1
experimental <- rnorm(30, mean = 4.2, sd = 1.1)

# Revisemos estadísticos descriptivos
mean(control); sd(control)
## [1] 3.452896
## [1] 0.9810307
mean(experimental); sd(experimental)
## [1] 4.396172
## [1] 0.9186407

Explica los resultados de las medidas

En las medidas que se tomaron se encontro que la media del grupo de control se encuentra en 3.45 cm, con una desviacion estandar de 0.98 cm, mientras que la media del grupo experimental, ronda los 4.39 cm, con una desviacion estandar de 0.91. Esto demuestra que las vitaminas afectan de cierto modo el crecimiento de las plantas, lo que podemos observar en las medias de los grupos, ya que en la del grupo de control en donde no se le dieron vitaminas a las plantas, estas crecieron en promedio hasta 3.45, por otro lado, el grupo experimental al que se les brindo la vitamina tuvo un mayor crecimiento de hasta 4.3 cm en el mismo periodo, a su vez, la desviacion estandar del grupo de control es ligeramenre mayor, lo que indica mayor dispersion en el grupo de control que en el experimental.


2. Teorema del Límite Central

# Tomamos muchas muestras de tamaño 10 del grupo experimental
n <- 50
B <- 1000  # número de réplicas

medias <- replicate(B, mean(sample(experimental, n, replace = TRUE)))

hist(medias, breaks = 30, main = "Distribución muestral de la media",
     xlab = "Media de las muestras", col = "lightblue")

# Pregunta: ¿Qué pasa si cambiamos n = 10 por n = 50?

Respuesta: La distribucion muestral presentada en la tabla cambiara de manera que luzca similar al de una distribucion normal, esto es debido a que entre mayor sea el tamaño de la muestra y por ende esta se acerque mas a infinito, la media de la muestra se acerca cada vez mas a la media poblacional y esta se vuelve mas estrecha.

3. Intervalo de Confianza

# Calcular IC del 95% para la media del grupo experimental
t.test(experimental, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  experimental
## t = 26.211, df = 29, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  4.053146 4.739198
## sample estimates:
## mean of x 
##  4.396172

Interpreta el resultado: ¿estás 95% seguro de que la media poblacional está en qué rango?

En este caso, podemos determinar con un nivel de confianza del 95% que la media poblacional se encuentra en un rango comprendido de entre 4.05 cm y 4.73 cm. La —

4. Hipótesis

Hipótesis a probar:

  • H0: la vitamina no cambia el crecimiento (µ = 3.5)
  • H1: la vitamina sí cambia el crecimiento (µ ≠ 3.5)
t.test(experimental, mu = 3.5, alternative = "two.sided")
## 
##  One Sample t-test
## 
## data:  experimental
## t = 5.3433, df = 29, p-value = 9.772e-06
## alternative hypothesis: true mean is not equal to 3.5
## 95 percent confidence interval:
##  4.053146 4.739198
## sample estimates:
## mean of x 
##  4.396172

5. Tipos de Error

  • Error Tipo I: Concluir que la vitamina funciona cuando en realidad no.
  • Error Tipo II: No detectar el efecto cuando sí existe.

👉 Pregunta: ¿cuál sería más grave en este caso?

El error mas grave en este caso seria el error tipo 1, en el que se concluye que la vitamina funciona cuando en realidad no lo hace, ya que esta podria significar en una perdida economica significativa y en que se rechace la hipotesis nula cuando esta no debia ser rechazada.

6. Valor p y Decisión

# p-valor
resultado <- t.test(experimental, mu = 3.5)
resultado$p.value
## [1] 9.772454e-06

Si p < 0.05 rechazamos H0. ¿Qué significa esto?
¿Un resultado “significativo” siempre es relevante en la vida real?

Esto significa que se encontro que la tasa de error tipo 1 es mas pequeña que los resultados de aplha, lo que demuestra que existe una significancia en los efectos comprendidos y por lo tanto, no se dieron debido al azar.

Un resultado significativo no es siempre relevante en la vida real, debido a que relevancia estadistica no necesariamente se traduce en relevancia a la hora de realizar una medida ante cierto fenomeno estudiado o la necesidad de iniciar un proceso de accion, debido a que esto ultimo depende de muchos otros factores. ```