Prueba de hipotesis para el promedio

Leonardo Enciso - Bioestadística PUJ

Conceptos generales

  1. Estimación de parámetros: puntual y por intervalos
  2. Pruebas de hipótesis

Elementos de una prueba estadística

  1. Nivel de significancia

Elementos de una prueba estadística

Hipótesis nula e hipótesis alternativa

Ejemplo 1: Planteamiento de hipótesis

Ejemplo 1: Planteamiento de hipótesis

  1. Hipótesis nula: como se plantea en relación al parámetro poblacional, sería

Estadístico de prueba

Significancia estadística

Selección del estadístico de prueba

Caso Estadístico Región de aceptación
\(X\sim N(\mu, \sigma), \sigma^*\) conocido \(Z = \frac{\bar{X}-\mu_0}{\frac{\sigma}{\sqrt{n}}}\) \(Z^*<Z_\alpha\)
\(X\sim N(\mu, \sigma), \sigma^*\) desconocido \(T = \frac{\bar{X}-\mu_0}{\frac{\sigma}{\sqrt{n}}}\) \(T\leq t_{\alpha,n-1}\)

Caso 1: Varianza conocida

distribucionz

distribucionz

Ejemplo 1: Niveles de colesterol

Ejemplo 1: Niveles de colesterol

  1. Planteamiento de las hipótesis
  1. Estadístico de prueba
  1. Significancia
  1. P-Valor

#Conclusión - No hay evidencia suficiente para rechazar la hipótesis nula - No hay evidencia que el valor promedio de colesterol de la población femenina de la universidad difiere de la población femenina universitaria general

Ejemplo 2: Radioactividad ósea

Ejemplo 2: Radioactividad ósea

radiacion<-rnorm(7) ## Datos simulados con distribucion normal 
summary(radiacion)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -1.20135 -0.22560  0.10811  0.09042  0.51602  1.14530
  1. Información del problema

Ejemplo 2: Radioactividad ósea

library(BSDA)
## Loading required package: lattice
## 
## Attaching package: 'BSDA'
## The following object is masked from 'package:datasets':
## 
##     Orange
z.test(radiacion, alternative = "less", mu = 0, sigma.x = 1)
## 
##  One-sample z-Test
## 
## data:  radiacion
## z = 0.23922, p-value = 0.5945
## alternative hypothesis: true mean is less than 0
## 95 percent confidence interval:
##         NA 0.7121115
## sample estimates:
##  mean of x 
## 0.09041525

Caso 2: Varianza desconocida

Distribución T

Posible casos

Primer caso: Una sola muestra

Primer caso: Una sola muestra

## Loading required package: MASS
## Loading required package: survival
## Loading required package: npsurv
## Loading required package: lsei

## summary statistics
## ------
## min:  -15.25   max:  12.22 
## median:  -1.41 
## mean:  -1.099744 
## estimated sd:  5.990888 
## estimated skewness:  0.1589711 
## estimated kurtosis:  3.226609

Primer caso: Una sola muestra

t.test(pib, alternative=c("two.sided"), mu = 0.95, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  pib
## t = -2.1367, df = 38, p-value = 0.03912
## alternative hypothesis: true mean is not equal to 0.95
## 95 percent confidence interval:
##  -3.0417650  0.8422778
## sample estimates:
## mean of x 
## -1.099744

Segundo caso: Muestras emparejadas

Ejemplo: Dieta de la naranja

Ejemplo: Dieta de la naranja

  1. Se calcula la diferencia entre los valores del peso antes y después de la intervención
  2. Se plantea la hipótesis nula. En este caso, la hipótesis es que la diferencia entre los promedios es igual a 0
  3. \(H_o: \mu=0\)
  4. \(H_a: \mu \neq 0\)
  5. Se calcula la diferencia entre el peso antes y despues y su promedio
  6. Se aplica el estadístico de prueba T
  7. \(T=\frac{\bar{x}-0}{\frac{s}{\sqrt{n}}}\)

Ejemplo: Dieta de la naranja

pesoantes<-c(65 ,58, 51, 51, 73, 75, 57, 56, 73, 80, 74, 77, 62, 51, 76, 54, 80, 46, 63, 50)
pesodepues<-c(58 ,69 ,75, 77, 78, 68, 53, 53, 76, 70, 76, 61, 51, 57, 45, 67, 61, 55, 46, 72)
difpeso<-pesodepues-pesoantes
mean(difpeso)
## [1] -0.2
sd(difpeso)
## [1] 15.20249

Ejemplo: Dieta de la naranja

## 
##  One Sample t-test
## 
## data:  difpeso
## t = -0.058834, df = 19, p-value = 0.9537
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  -7.314986  6.914986
## sample estimates:
## mean of x 
##      -0.2

Tercer caso: Comparación del promedio de dos muestras

  1. Ensayos aleatorizados: un grupo a tratamiento A y otro a tratamiento B
  2. Hombres y mujeres

Tercer caso: Comparación del promedio de dos muestras

Caso 3.1 Comparación cuando las varianzas muestrales son diferentes

  1. Utilizando un valor calculado de los datos que no es en general un número entero
  2. Utilizando el valor menor entre (n1-2)(n2-1)

Estadístico de prueba para dos muestras con varianzas diferentes

\(T= \frac{(\bar{x_1}-\bar{x_2})-(\mu_1-\mu_2)}{\sqrt{\frac{s_1^2}{n1}+\frac{s_2^2}{n_2}}}\)

Ejemplo: Peso marsupiales

Ejemplo: Peso marsupiales

rata_cafe<-c(24 ,43 ,58, 71, 43, 49, 61, 44, 67, 49, 53, 56, 59, 52, 62, 54, 57, 33, 46, 43, 57)
rata_control<-c(42 ,43 ,55 ,26 ,62 ,37 ,33 ,41 ,19 ,54 ,20, 85, 46, 10, 17, 60, 53, 42, 37, 42, 55, 28, 48)
summary(rata_cafe)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   24.00   44.00   53.00   51.48   58.00   71.00
summary(rata_control)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   10.00   30.50   42.00   41.52   53.50   85.00
sd(rata_cafe)
## [1] 11.00736
sd(rata_control)
## [1] 17.14873

Ejemplo: Peso marsupiales

Ejemplo: Peso marsupiales

## 
##  F test to compare two variances
## 
## data:  rata_cafe and rata_control
## F = 0.412, num df = 20, denom df = 22, p-value = 0.05067
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.1724602 1.0026844
## sample estimates:
## ratio of variances 
##          0.4120045

Ejemplo: Peso marsupial

## 
##  Welch Two Sample t-test
## 
## data:  rata_cafe and rata_control
## t = 2.3109, df = 37.855, p-value = 0.01319
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  2.691293      Inf
## sample estimates:
## mean of x mean of y 
##  51.47619  41.52174

Caso 3.2: Comparación de la media de dos poblaciones con varianzas iguales

Ejemplo: Calcio e hipertensión arterial

Ejemplo: calcio e hipertension arterial

Ejemplo: calcio e hipertensión arterial

calcio<-c(7, -4, 18, 17, -3, -5, 1, 10, 11, -2. -3)
control<-c(-1, 12, -1, -3, 3, -5, 5, 2, -11, -1)
mean(calcio)
## [1] 4.7
sd(calcio)
## [1] 9.055999
mean(control)
## [1] 0
sd(control)
## [1] 6.146363

Ejemplo; calcio e hipertension arterial

var.test(calcio, control)
## 
##  F test to compare two variances
## 
## data:  calcio and control
## F = 2.1709, num df = 9, denom df = 9, p-value = 0.2637
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.5392165 8.7399597
## sample estimates:
## ratio of variances 
##           2.170882

Ejemplo: calcio e hipertension arterial

## 
##  Two Sample t-test
## 
## data:  calcio and control
## t = 1.358, df = 18, p-value = 0.1913
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.571403 11.971403
## sample estimates:
## mean of x mean of y 
##       4.7       0.0