Inferencia estadística
Caso de estudio 1
¿Tienen relacion las búsquedas en México de depresion y suicidios?
Mi hipótesis nula es que SI tienen relación dado que cuando existe un interés de búsqueda en depresion, la gente también busca informarse de suicidios
- Colectar datos
library(pacman)
p_load("readr","DT")
depsui<- read_csv("depresion.csv",
col_types = cols(depresion = col_number(),
suicidios = col_number()))
datatable(depsui)- ¿Están relacionados los datos?
Matriz de diagramas de dispersión
- Matriz de coeficientes de correlación
## depresion suicidios
## depresion 1.0000000 0.2370842
## suicidios 0.2370842 1.0000000
- Recta de mínimos cuadrados
##
## Call:
## lm(formula = depresion ~ suicidios, data = depsui)
##
## Residuals:
## Min 1Q Median 3Q Max
## -15.406 -5.757 -2.962 3.873 40.965
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 51.922 4.706 11.034 5.3e-15 ***
## suicidios 2.371 1.374 1.726 0.0906 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 10.12 on 50 degrees of freedom
## Multiple R-squared: 0.05621, Adjusted R-squared: 0.03733
## F-statistic: 2.978 on 1 and 50 DF, p-value: 0.09059
- Ecuación de la recta de mínimos cuadrados
\[ y = 51.922 + 2.371x \]
- Trazado de la recta de minimos cuadrados
plot(depsui$depresion, depsui$suicidios, xlab="Busquedas de depresion", ylab="busquedas de suicidios")
abline(regresion)- Comparacion de proporciones de los datos
- Análisis de tendencia central
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 46.00 52.00 58.00 59.67 66.25 100.00
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 3.000 3.000 3.269 4.000 7.000
- Análisis de dispersión
## [1] 10.31223
## [1] 1.031188
¿Qué podemos concluír con esto?
Que las variables SI están relacionadas, pero NO podemos inferir que existe aún una causalidad.