Práctica Pruebas de Hipótesis

Prueba t para muestras independientes

Ejemplo 1

Ward & Quinn (1988) recogierón 37 cápsulas de huevo del gasterópodo depredador intermareal Lepsiella vinosa de la zona littorinada en una costa intermareal rocosa y 42 cápsulas de la zona del mejillón. Otros datos indicaron que las tasas de consumo de energía por L. vinosa eran mucho mayores en la zona del mejillón por lo que había interés en las diferencias en la fecundidad entre las zonas. La H0 era que no hay diferencia entre las zonas en el número medio de huevos por cápsula.

Esta es una comparación independiente porque cápsulas de huevo individuales sólo pueden estar sólo en una de las dos Zonas.

En el ejemplo seguiremos los pasos descritos en clase

1. Especifique H0, HA y la estadística de prueba apropiada

La H0 de investigación esta dada (no hay diferencia entre las zonas en el número medio de huevos por cápsula).

\(H0 : \mu _{Litto} = \mu _{Mussel}\) \(H0 : \mu _{Litto} - \mu _{Mussel}= 0\)

\(HA : \mu _{Litto} \neq \mu _{Mussel}\) \(HA : \mu _{Litto} - \mu _{Mussel}\neq 0\)

2. Especifique un nivel de significancia a priori

El error tipo I \(\alpha\) = 0.01

3. Recopile los datos y calcule el estadístico de prueba.

En este caso los datos estan en el archivo ward.csv, inicialmente realizaremos un análisis exploratorio de los datos

# Leemos los datos
library(readr)
ward <- read_csv("ward.csv")

## 
## ── Column specification ────────────────────────────────────────────────────────
## cols(
##   ZONE = col_character(),
##   EGGS = col_double()
## )

ward

library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

ward %>%
  group_by(ZONE) %>%
  summarise(n = n(), 
            Media = mean(EGGS),
            Mediana = median(EGGS) , 
            Desviacion = sd(EGGS), 
            std_mean = sd(EGGS)/sqrt(length(EGGS)
                                     )
            )

#Realizamos un boxplot
library(ggplot2)
# Basic box plot
p <- ggplot(ward, 
            aes(x = ZONE,
                y = EGGS, 
                color = ZONE)
            ) + 
  geom_boxplot(outlier.colour = "blue", 
               notch = FALSE) +
  labs(y="Número de huevos")
p

Observamos que las desviaciones estándar (y por lo tanto las varianza) son similares y las gráficas de caja de la figura no sugieren una fuerte asimetría por lo que una prueba paramétrica t podría ser apropiada. La selección del estadístico de prueba depende de la forma de la población, de si las varianzas poblacionales son conocidas o no, si dichas varianzas son homogeneas o no y del tamaño de las muestras, sin embargo, para ratificar se realizaran las pruebas de verificación de supuestos.

La verificación del supuesto de normalidad la realizaremos con la prueba de Shapiro-Wilks, mientras que la prueba de homogeneidad de varianzas con la prueba F de Fisher.

#  En este caso la hipótesis nula de la prueba de Shapiro
#dice que los datos provienen de   una  distribución normal
 
Mussel <- filter(ward, ZONE== "Mussel")
shapiro.test(Mussel$EGGS)

## 
##  Shapiro-Wilk normality test
## 
## data:  Mussel$EGGS
## W = 0.93413, p-value = 0.0179

Littor <- filter(ward, ZONE== "Littor")
shapiro.test(Littor$EGGS)

## 
##  Shapiro-Wilk normality test
## 
## data:  Littor$EGGS
## W = 0.96509, p-value = 0.2915

El resultado de la prueba de Shapiro nos muestra que los datos provienen e una distribución normal los p-values son mayores a 0.01

# la hipótesis nula de la prueba de homogeneidad de varianzas  dice
# que las varianzas son homogeneas
var.test(EGGS ~ ZONE, 
         alternative='two.sided',
         conf.level=.99,
         data = ward )

## 
##  F test to compare two variances
## 
## data:  EGGS by ZONE
## F = 0.76601, num df = 36, denom df = 41, p-value = 0.4183
## alternative hypothesis: true ratio of variances is not equal to 1
## 99 percent confidence interval:
##  0.3308138 1.8098226
## sample estimates:
## ratio of variances 
##           0.766006

El p-valor de la prueba es 0.4183 es mayor que el nivel de significancia, por lo que podemos concluir que no hay evidencia para rechazar que las varianzas sean homogéneas.

Los resultados anteriores nos muestran que el estadístico de prueba es una t-student. El cálculo del estadistico lo realizamos con la función t.test()

t.test(x~y,
       data=MyDataset,
       alternative = c("two.sided", "less", "greater"),
       mu = 0, 
       paired = FALSE, 
       var.equal = TRUE,
       conf.level = 0.95)

Los argumentos de la función t.test() se describen a continuación:

x: Es la columna (vector) que contiene los datos númericos (EGGS)

y: Es la columna (vector) que contiene el factor (ZONE)

data: Nombre del dataframe (ward)

alternative: Debe seleccionarse una de las tres opciones (“two.sided”, “less”, “greater“)dependiendo de si la prueba de hipótesis es a dos colas (”two.sided" cuando la hipótesis alterna dice “es diferente”), o a una cola (“less” menor que o “greater” mayor que

mu: Es el valor especificado en la hipótesis nula

paired: Indica si la muestras son independientes (FALSE) o dependientes (TRUE)

var.equal : Depende del resultado del var.test si las varianzas son homogeneas colocamos TRUE, en caso contrario colocamos FALSE (esta seria la t de Welch)

conf.level: Indica el nivel de confianza.

t.test(EGGS~ZONE,data = ward,
       alternative = "two.sided",
       mu = 0, 
       paired = FALSE, 
       var.equal = TRUE,
       conf.level = 0.99)

## 
##  Two Sample t-test
## 
## data:  EGGS by ZONE
## t = -5.3899, df = 77, p-value = 7.457e-07
## alternative hypothesis: true difference in means is not equal to 0
## 99 percent confidence interval:
##  -3.955199 -1.353681
## sample estimates:
## mean in group Littor mean in group Mussel 
##             8.702703            11.357143

En este punto podriamos tener dos posibles resultados (y conclusiones)

Si la probabilidad (p-value) de obtener este valor o uno mayor es menor que la significación especificada, a continuación, concluir que el H0 es falso y rechazarlo (resultado “significativo”),
Si la probabilidad (p-value) de obtener este valor es mayor o igual que el especificado nivel de significancia, a continuación, concluir allí no hay evidencia de que la H0 sea falsa (resultado “no significativo”).

En nuestro caso la conclusión estadística sería que con una confianza del 99 % se rechaza la H0 (t=-5.389, df=77,p-value < 0.001), es decir, en terminos de la investigacion llegamos a la conclusión de que existe una diferencia estadísticamente significativa en el número medio de huevos por cápsula entre zonas. Otra forma de expresar la conclusion sería : La producción de huevos por gasterópodos depredadores (Lepsiella vinosa fue significativamente mayor (t=-5.389,p-value < 0.001)) en las zonas de mejillones que en las de littorínidos en costas intermareales rocosas.

library(ggplot2)
library(Hmisc)

## Loading required package: lattice

## Loading required package: survival

## Loading required package: Formula

## 
## Attaching package: 'Hmisc'

## The following objects are masked from 'package:dplyr':
## 
##     src, summarize

## The following objects are masked from 'package:base':
## 
##     format.pval, units

ggplot(data=ward,mapping=aes(x=ZONE,y=EGGS)) +
    geom_jitter(alpha=0.25,width=0.01) +
  stat_summary(fun.data= "mean_cl_normal",
               geom ="pointrange",
               size = 1.1,
               fatten = 3,
               pch = 21,
               fill = "red",
               colour = "black")+
  labs(y="Número de huevos")

Ejemplo 2

Furness y Bryant (1996) estudiaron el gasto energético de la cría de fulmares del norte ( Fulmarus glacialis) en Shetland. Como parte de su estudio, registraron varias características de fulmares masculinos y femeninos etiquetados individualmente. Nos centraremos en las diferencias entre sexos en la tasa metabólica. Había ocho machos y seis hembras etiquetado. La H0 era que no hay diferencia entre los sexos en la media tasas metabólicas de fulmares.

Esta es una comparación independiente porque los individuos (fulmares) solo pueden ser machos o hembras.

1. Especifique H0, HA y la estadística de prueba apropiada

La H0 de investigación esta dada (no hay diferencia entre sexos en la tasa metabolica).

\(H0 : \mu _{machos} = \mu _{hembras}\) \(H0 : \mu _{machos} - \mu _{hembras}= 0\)

\(HA : \mu _{machos} \neq \mu _{hembras}\) \(HA : \mu _{machos} - \mu _{hembras}\neq 0\)

2. Especifique un nivel de significancia a priori

El error tipo I \(\alpha\) = 0.05

3. Recopile los datos y calcule el estadístico de prueba.

Los datos estan en el archivo ward.csv, inicialmente realizaremos un análisis exploratorio de los datos

# Leemos los datos
library(readr)
furness <- read_csv("furness.csv")

## 
## ── Column specification ────────────────────────────────────────────────────────
## cols(
##   SEX = col_character(),
##   METRATE = col_double()
## )

furness

library(dplyr)
furness %>%
  group_by(SEX) %>%
  summarise(n = n(), 
            Media = mean(METRATE),
            Mediana = median(METRATE) , 
            Desviacion = sd(METRATE), 
            std_mean = sd(METRATE)/sqrt(length(METRATE)
                                     )
            )

#Realizamos un boxplot
library(ggplot2)
# Basic box plot
p <- ggplot(furness, 
            aes(x = SEX,
                y = METRATE, 
                color = SEX)
            ) + 
  geom_boxplot(outlier.colour = "blue", 
               notch = FALSE) +
  labs(y="Tasa metabolica")
p

#  En este caso la hipótesis nula de la prueba de Shapiro
#dice que los datos provienen de   una  distribución normal
Machos <- filter(furness, SEX == "Male")
shapiro.test(Machos$METRATE)

## 
##  Shapiro-Wilk normality test
## 
## data:  Machos$METRATE
## W = 0.92361, p-value = 0.4599

Hembras <- filter(furness, SEX == "Female")
shapiro.test(Hembras$METRATE)

## 
##  Shapiro-Wilk normality test
## 
## data:  Hembras$METRATE
## W = 0.97003, p-value = 0.8926

Si bien no hay evidencia de no normalidad (los diagramas de caja no son muy asimétricos y la prueba de Shapiro lo corrobora), las desviaciones y por tanto las varianzas son un poco desiguales (aunque quizás no muy desiguales: uno de los diagramas de caja no es más de tres veces más pequeño que el otro). Por lo tanto, una prueba t de varianzas separada (t de Welch) es más apropiado que una prueba t de varianzas agrupadas.

t.test(METRATE~SEX,data = furness,
       alternative = "two.sided",
       mu = 0, 
       paired = FALSE, 
       var.equal = FALSE,
       conf.level = 0.95)

## 
##  Welch Two Sample t-test
## 
## data:  METRATE by SEX
## t = -0.77317, df = 10.468, p-value = 0.4565
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1075.3208   518.8042
## sample estimates:
## mean in group Female   mean in group Male 
##             1285.517             1563.775

En este caso la conclusión sería: con una confianza del 95 % no rechamos la hipótesis nula, es decir, la tasa metabólica de la cría de machos y hembras no difiere significativamente (t = −0,773, gl = 10,468, P = 0,457).

library(ggplot2)
library(Hmisc)
ggplot(data = furness,mapping=aes(x = SEX,y = METRATE)) +
    geom_jitter(alpha=0.25,width=0.01) +
  stat_summary(fun.data= "mean_cl_normal",
               geom ="pointrange",
               size = 1.1,
               fatten = 3,
               pch = 21,
               fill = "red",
               colour = "black")+
  labs(y="")

Prueba t para muestras pareadas

Elgar et al. (1996) expuso 17 arañas orbe cada una a condiciones de luz y oscuridad y registró dos aspectos de la estructura de las redes bajo cada condición. las H0 fueron que las variables (diámetro vertical y diámetro horizontal de la red orbe) fueron iguales en condiciones de luz y poca luz.

Dado que la misma araña tejió su tela en ambos condiciones de luz, entonces esta fue una comparación pareada.

En este caso tenemos probaremos las siguientes hipótesis:

Hipótesis sobre efecto de iluminacion en el ancho de la red

\(H0 : \mu _{DifHorizontal} = 0\)

\(HA : \mu _{DifHorizontal} \neq 0\)

Hipótesis sobre efecto de iluminacion en la altura de la red \(H0 : \mu _{DifVertical} = 0\)

\(HA : \mu _{DifVertical} \neq 0\)

En este caso resolveremos la primera hupòtesis, es decir la de diferencias horizontales, la segunda queda como ejercicio.

elgar <- read_csv("elgar.csv")

## 
## ── Column specification ────────────────────────────────────────────────────────
## cols(
##   PAIR = col_character(),
##   VERTDIM = col_double(),
##   HORIZDIM = col_double(),
##   VERTLIGH = col_double(),
##   HORIZLIG = col_double()
## )

elgar

Como se trata de una hipótesis pareada, debemos calcular inicialmente la diferencia entre las dimensiones horizontales de la red en ambas condiciones de luz.

library(dplyr)
DifHor <- mutate(elgar, Dif= HORIZDIM-HORIZLIG)
DifHor

#Realizamos un boxplot
library(ggplot2)
# Basic box plot
p <- ggplot(DifHor, 
            aes(y = Dif)
            ) + 
  geom_boxplot(outlier.colour = "blue", 
               notch = FALSE) +
  labs(y="")
p

shapiro.test(DifHor$Dif)

## 
##  Shapiro-Wilk normality test
## 
## data:  DifHor$Dif
## W = 0.9727, p-value = 0.8637

La prueba de Shapiro revela que la diferencia se distribuye como una normal.

with(elgar, t.test(HORIZDIM, HORIZLIG, paired = T, conf.level = 0.95))

## 
##  Paired t-test
## 
## data:  HORIZDIM and HORIZLIG
## t = 2.1482, df = 16, p-value = 0.04735
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##   0.6085725 91.7443687
## sample estimates:
## mean of the differences 
##                46.17647

Con una confianza del 95 % se rechaza la Hipótesis nula. Se encontró que las telarañas eran significativamente más anchas (t = 2.148, df = 16, P = 0.0473) en condiciones de poca luz.

Referencias

Elgar, M.A., Allan, R.A. & Evans, T.A. (1996) Foraging strategies in orb-spinning spiders: ambient light and silk decorations in Argiope aetherea Walckenaer (Araneae: Araneoidea). Australian Journal of Ecology 21: 464–467.

Ward, S. & Quinn, G.P. (1988) Preliminary investigations of the ecology of the predatory gastropod Lepsiella vinosa (Lamarck) (Gastropoda Muricidae). Journal of Molluscan Studies 54: 109–117

Furness, R.W. & Bryant, D.M. (1996) Effect of wind on field metabolic rates of breeding Northern Fulmars. Ecology 77: 1181–1188.