Inferencia estadística
Caso de estudio 1
Busquedas de covid y cubrebocas
¿Tienen relación las búsquedas en México de cubrebocas y covid?
Mi hipótesis nula es que SI tienen relación dado que cuando existe un interés de búsqueda en covid, la gente también buscar informarse de cubrebocas
- Colectar datos
library(pacman)
p_load("readr","DT")
busquedas <- read_csv("busquedas.csv", col_types = cols(covid = col_number(), cubrebocas = col_number()))
View (busquedas)
head(busquedas)## # A tibble: 6 x 2
## covid cubrebocas
## <dbl> <dbl>
## 1 0 0
## 2 0 0
## 3 0 0
## 4 0 0
## 5 0 0
## 6 0 0
- ¿Están relacionados los datos?
Matriz de diagramas de dispersión
- Matriz de coeficientes de correlación
## covid cubrebocas
## covid 1.0000000 0.9356061
## cubrebocas 0.9356061 1.0000000
- Recta de mínimos cuadrados
##
## Call:
## lm(formula = cubrebocas ~ covid, data = busquedas)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.8747 -1.2513 -0.4953 0.5047 7.0884
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.495288 0.433409 1.143 0.259
## covid 0.138774 0.007406 18.739 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.144 on 50 degrees of freedom
## Multiple R-squared: 0.8754, Adjusted R-squared: 0.8729
## F-statistic: 351.2 on 1 and 50 DF, p-value: < 2.2e-16
- Ecuación de la recta de mínimos cuadrados
\[y = 0.495288 + 0.138774x\]
- Trazado de la recta de mínimos cuadrados
plot(busquedas$covid, busquedas$cubrebocas, xlab="busquedas de covid", ylab="busquedas de cubrebocas")
abline(regresion)- Comparación de proporciones de los datos
- Análisis de tendencia central
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 49.50 42.58 82.25 100.00
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 0.000 7.500 6.404 11.000 21.000
*Análisis de dispersión
## [1] 40.54547
## [1] 6.013904
¿Qué podemos concluir con esto?
Que las variables SI están relacionadas, pero no podemos inferir que existe aún una causalidad.
Caso de estudio 2
¿Se relacionarán las búsquedas de celulares nuevos y las de cristal templado en México?
Mi hipótesis nula es que SI tienen relación debido a que cuando una persona adquiere un celular nuevo, también desea adquirir protección para el cuidado de su celular
- Colectar datos
busquedas2 <- read_csv("celularescristal.csv", col_types = cols(celulares = col_number(), cristal = col_number()))
View (busquedas2)
head(busquedas2)## # A tibble: 6 x 2
## celulares cristal
## <dbl> <dbl>
## 1 22 48
## 2 22 65
## 3 20 70
## 4 22 53
## 5 20 54
## 6 38 67
- ¿Están relacionados los datos?
Matriz de diagramas de dispersión
- Matriz de coeficientes de correlación
## celulares cristal
## celulares 1.0000000 0.4970454
## cristal 0.4970454 1.0000000
- Recta de mínimos cuadrados
##
## Call:
## lm(formula = celulares ~ cristal, data = busquedas2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -13.6818 -3.7396 -0.0605 2.8919 14.0754
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.65851 4.22699 1.812 0.076024 .
## cristal 0.24278 0.05994 4.050 0.000178 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.848 on 50 degrees of freedom
## Multiple R-squared: 0.2471, Adjusted R-squared: 0.232
## F-statistic: 16.41 on 1 and 50 DF, p-value: 0.000178
- Ecuación de la recta de mínimos cuadrados
\[y = 7.65851 + 0.24278x\]
- Trazado de la recta de mínimos cuadrados
plot(busquedas2$cristal, busquedas2$celulares, xlab="busquedas de cristal templado", ylab="busquedas de celulares nuevos")
abline(regresion)- Comparación de proporciones de los datos
- Análisis de tendencia central
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 33.00 59.75 67.50 69.21 77.00 100.00
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 10.00 20.00 23.00 24.46 27.25 39.00
*Análisis de dispersión
## [1] 13.66165
## [1] 6.672923
¿Qué podemos concluir con esto?
Que tienen una correlación baja, aunque pareciera que ambas serían causales; no se puede deducir que ambas estén altamente relacionas en las búsquedas.
Redacción personal
En el caso #2 las variables tiene una correlacion del 0.49, podría denotarse un poco baja en comparación a la del covid y cubrebocas . Sin embargo se manifiesta una causalidad ya que es común que una persona que adquiera un celular nueva quiera tener una precaución y tambien busque cristal templado, pero se descartan muchas opciones, como la de alguien que solo le interese el cristal aunque su celular no sea nuevo.