1 Situación problema. Ejercicio 25.

En los últimos tiempos hay una cantidad cada vez mayor de opciones de entretenimiento que compiten por el tiempo de los consumidores. En 2004, la televisión por cable y el radio superaron a la televisión abierta, a la música grabada y a los periódicos, convirtiéndose en los medios de entretenimiento más usados. Con una muestra de 15 individuos se obtienen los datos de las horas por semana que ven televisión por cable y de las horas por semana que escuchan la radio.

individuos television radio
1 22 25
2 8 10
3 25 29
4 22 19
5 12 13
6 26 28
7 22 23
8 19 21
9 21 21
10 23 23
11 14 15
12 14 18
13 14 17
14 16 15
15 24 23

1.1 Análisis del ejercicio

En este caso, tenemos como hipotesis nula que no hay diferencia de medias entre la cantidad de horas por semana que los individuos usan para ver television y escuchar la radio. Por otro lado, como hipotesis alternativa tenemos que existe diferencia entre las medias de las horas por semana que los individuos usan para ver television y escuchar la radio. Esto es,

\(H_0: \mu_1 - \mu_2 = 0\)

\(H_1: \mu_1 - \mu_2 \neq 0\)

1.1.1 Descriptivo de datos

Con los datos del ejercicio podemos hacer diagramas que nos faciliten la visualización de los datos:

*La línea azul representa la media de cada boxplot.

El gráfico anterior nos muestra la caja del driagrama casi completamente centrada en ambos casos, lo que significa que la distibución es simétrica. Además, no tienen datos atípicos y las medianas están cerca de la media, entonces se podría afirmar que sigue una distribución normal. Sin embargo, esto se confirmará más adelante.

##    television       radio   
##  Min.   : 8.0   Min.   :10  
##  1st Qu.:14.0   1st Qu.:16  
##  Median :21.0   Median :21  
##  Mean   :18.8   Mean   :20  
##  3rd Qu.:22.5   3rd Qu.:23  
##  Max.   :26.0   Max.   :29

El resumen de cinco números detalla (de manera menos visual, pero más clara) algo que ya se había inferido de los diagramas: que el valor de la media está cerca de la mediana.

A continuación, se muestran las desviaciones estándar respecto al número de horas por semana que los individuos escuchan la radio y el número de horas por semana que los individuos ven la televisión, respectivamente:

## [1] 5.424811
## [1] 5.414267

1.1.2 Test de normalidad

Teniendo en cuenta que el tamaño de la muestra es menor a 50 (\(n = 15\)), se realiza el test de Shapiro-Wilk para comprobar la normalidad de los datos con nivel de significancia 0.05:

## 
##  Shapiro-Wilk normality test
## 
## data:  test
## W = 0.95863, p-value = 0.6686

Puesto que el p-valor es de \(0.66 > 0.05\) y el estadístico W es cercano a \(1\), podemos afirmar que no hay evidencias estadísticamente significativas de que las diferencias no sigan una distribución normal.

1.1.3 Prueba t pareada

Ahora, notemos que en el ejercicio tenemos dos muestras dependientes, por lo que será necesario aplicar una prueba t pareada para determinar si hay diferencia estadísticamente significativa entre la media de horas por semana en que los individuos ven televisión y la media de horas por semana en que escuchan la radio.

## 
##  Paired t-test
## 
## data:  table$television and table$radio
## t = -2.3577, df = 14, p-value = 0.03347
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
##  -2.2916261 -0.1083739
## sample estimates:
## mean difference 
##            -1.2

Con lo anterior, se obtiene un p-valor de \(0.03347 < 0.05\) por lo que se rechaza la hipótesis nula. Es decir, podemos afirmar que sí hay evidencia estadísticamente significativa entre la media de horas por semana en que los individuos ven televisión y la media de horas por semana en que escuchan la radio.