Comparación de medias

Dr. Marco Aurelio González Tagle
21/05/2015

Comparación de medias de muestras dependientes

Introducción

En algunos experimentos el investigador esta intersado en encontrar diferencias entre una característica en particular de los individuos de la misma población despues de aplicar un tratamiento o después de dejarlos crecer en el tiempo.

Las características pueden ser

  • Altura promedio antes y despues de fertilizar las plántulas
  • Diámetro promedio antes y despues de fertilizar las plántulas
  • Humedad del suelo antes y despues de aplicar un riego

Hipótesis

Establecer una hipótesis de trabajo es muy importante en la investigación.

Ejemplo: Un viverista realizó un experimento: con con un grupo de plantas producidas en un solo tipo de contenedor y aplicó un fertilizante y esta interesado en encontrar si existen diferencias en la altura promedio de las plántulas a los seis meses de edad.

Hipótesis

¿Por que esta ineteresado el viverista en conocer si el fertilizante genera mayor altura en las plátulas?

Conocer el efecto del fertilizante en el crecimeinto, el viverista puede:

  • Podrá decidir si aplica o no el fertilizante
  • Podrá identificar si existe un crecimiento real y cuantificarlo

Hipótesis

La hipotesis nula (\( \mu_{0} \))

  1. La \( \mu \) de la variable altura no se ve afectado por la aplicación del fertilizante.

La hipotesis alternativa (\( \mu_{1} \))

Caso contrario, se establece una hipótesis alternativa (\( \mu_{1} \)) que espresa la diferencia en el crecimiento debido a la fertilización.

Prueba de t

Existen tres tipos de prueba de t:

  1. de una muestra
  2. dos muestras independientes
  3. dos muestras apareadas o dependientes

Prueba de t de muestras dependientes

La media del crecimiento antes de la aplicación del fertilizante (\( \mu_{a} \)) se contrasta con la media del crecimiento después de aplicar el fertilizane (\( \mu_{d} \)) en el experimento en el vivero:

Ejemplo

  • Comparar si existen diferencias con la media del crecimiento antes y despues de la aplicación del fertilizante

Establecer una Hipótesis de partida

Se incia con establecer una hipótesis nula o de partida:

  1. La \( \mu_{A} \) de las plántulas antes de la fertilización es igual a la media después de la fertilización.

Establecer una Hipótesis alternativa

Una vez establecida la hipótesis nula o de partida, se establece la Hipótesis alternativa

  1. La \( \mu_{a} \) del crecimiento de las plántulas antes de la fertilización es igual a la media de crecimiento después de la fertilización \( \mu_{d} \)
  2. La \( \mu_{a} \) del crecimiento de las plántulas antes de la fertilización es diferente a la media de crecimiento después de la fertilización \( \mu_{d} \)

Ejemplo

Importar los datos a R utilizando la base de datos crecimiento.csv que contiene las columnas crecimiento y fecha. Datos en el Blog

setwd("/Volumes/TOSHIBA/Rstudio/Principios_estadistica/Data")
vivero <- read.csv("crecimiento.csv")
head(vivero)
  crecimiento fecha
1         8.4 Antes
2        10.3 Antes
3        12.4 Antes
4         9.7 Antes
5         8.6 Antes
6         9.3 Antes

Ejemplo (continuación)

Representación gráfica de los datos

boxplot(vivero$crecimiento ~ vivero$fecha, xlab = "Fecha", ylab = "crecimiento (cm)")

Crecimiento de acuerdo al fertilizante

Establecer el análisis usando R

Recordamos que estamos realizando una prueba de t de muestras depenientes, por lo tanto en la formula aplicamos la restricción paired=T

el procedimiento es muy sencillo:

t.test(vivero$crecimiento ~ vivero$fecha, paired=T)

Interpretar (1)

Obetenemos la siguiente salida


    Paired t-test

data:  vivero$crecimiento by vivero$fecha
t = -1.8143, df = 17, p-value = 0.08732
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -1.3457936  0.1013492
sample estimates:
mean of the differences 
             -0.6222222 

Interpretar

  1. La media de crecimiento es en el contendor A es de 9.9277778 cm
  2. La media de crecimiento es en el contendor B es de 10.55 cm
  3. el valor de P es igual a 0.0873201
  4. Los grados de libertad son 17 (n-1)
    • Es decir tenemos en total 18 pares de observaciones

Interpretar

¿Cuál es la diferencia entre las medias de crecimiento?

La diferencia entre las medias del crecimiento es de -0.6222222, es decir las medias antes de aplicar el fertilizante solo median -0.6222222 que la altura final de 10.55 cm, por lo tanto la altura promedio incial fue de 9.9277778 cm

Aceptar o rechazar la Hipótesis nula

Tomamos en cuenta el valor de P (P-value) en la prueba de t= 0.0873201 y seguimos el siguiente criterio

Se acepta la Ho cuando

  • P-value es > que 0.05

Se rechaza Ho es decir aceptamos H1 cuando

  • P-value es < que 0.05

Respuesta

Aceptamos la H0 y entonces podemos decir que el crecimeinto antes y despues del fertilizante es igual

Que pudo ocurrir para que no existieran diferencias? Primeramente, hay que revisar los siguientes puntos:

  1. La concentración del fertilizante no fue la óptima para que se presentarán diferencias
  2. La elección del fertilizante no fue correta

ó quizas efectivamente la concentración fue la indicada y no existión diferencia alguna. 3