U1A12

Erick Luke

26/9/2020

library(pacman)
p_load("prettydoc")

Inferencia estadística

Caso de estudio 1

¿Tienen relacion las búsquedas en México de depresion y suicidios?

Mi hipótesis nula es que SI tienen relación dado que cuando existe un interés de búsqueda en depresion, la gente también busca informarse de suicidios

  • Colectar datos
library(pacman)
p_load("readr","DT")
depsui<- read_csv("depresion.csv", 
    col_types = cols(depresion = col_number(), 
        suicidios = col_number()))
datatable(depsui)
  • ¿Están relacionados los datos?

Matriz de diagramas de dispersión

pairs(depsui)

  • Matriz de coeficientes de correlación
cor(depsui)
##           depresion suicidios
## depresion 1.0000000 0.2370842
## suicidios 0.2370842 1.0000000
  • Recta de mínimos cuadrados
regresion <-lm(depresion ~ suicidios, data=depsui )
summary(regresion)
## 
## Call:
## lm(formula = depresion ~ suicidios, data = depsui)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -15.406  -5.757  -2.962   3.873  40.965 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   51.922      4.706  11.034  5.3e-15 ***
## suicidios      2.371      1.374   1.726   0.0906 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 10.12 on 50 degrees of freedom
## Multiple R-squared:  0.05621,    Adjusted R-squared:  0.03733 
## F-statistic: 2.978 on 1 and 50 DF,  p-value: 0.09059
  • Ecuación de la recta de mínimos cuadrados

\[ y = 51.922 + 2.371x \]

  • Trazado de la recta de minimos cuadrados
plot(depsui$depresion, depsui$suicidios, xlab="Busquedas de depresion", ylab="busquedas de suicidios")
abline(regresion)

  • Comparacion de proporciones de los datos
boxplot(depsui$depresion ~ depsui$suicidios, col="grey")

  • Análisis de tendencia central
summary(depsui$depresion)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   46.00   52.00   58.00   59.67   66.25  100.00
summary(depsui$suicidios)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   3.000   3.000   3.269   4.000   7.000
  • Análisis de dispersión
sd(depsui$depresion)
## [1] 10.31223
sd(depsui$suicidios)
## [1] 1.031188

¿Qué podemos concluír con esto?

Que las variables SI están relacionadas, pero NO podemos inferir que existe aún una causalidad.

Caso de estudio 2