U1A12

Marian Gutiérrez

26/9/2020


Inferencias estadísticas

Caso de estudio 1

Cubrebocas

¿Tienen relación las busquedas en México de cubrebocas y covid?

Mi hipotesis nula es que SI tienen relación dado que cuando existe un interés de búsqueda en covid, la gente también busca información de cubrebocas

  • Colectar datos
library(readr)
busquedas <- read_csv("busquedas.csv", col_types = cols(covid = col_integer(), 
    cubrebocas = col_integer()))
head(busquedas)
## # A tibble: 6 x 2
##   covid cubrebocas
##   <int>      <int>
## 1     0          0
## 2     0          0
## 3     0          0
## 4     0          0
## 5     0          0
## 6     0          0
  • ¿Están relacionados los datos?

Matriz de diagramas de dispersión

pairs(busquedas)

  • Matriz de coeficiente de correlación
cor(busquedas)
##                covid cubrebocas
## covid      1.0000000  0.9356061
## cubrebocas 0.9356061  1.0000000
  • Trazado de la recta de mínimos cuadrados
regresion <- lm(cubrebocas~covid, data=busquedas)
summary(regresion)
## 
## Call:
## lm(formula = cubrebocas ~ covid, data = busquedas)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.8747 -1.2513 -0.4953  0.5047  7.0884 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 0.495288   0.433409   1.143    0.259    
## covid       0.138774   0.007406  18.739   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.144 on 50 degrees of freedom
## Multiple R-squared:  0.8754, Adjusted R-squared:  0.8729 
## F-statistic: 351.2 on 1 and 50 DF,  p-value: < 2.2e-16
  • Ecuacion de la recta de mínimos cuadrados

\[ y=0.495288+0.138774x \] * Trazado de la recta de mínimos cuadrados

plot(busquedas$covid, busquedas$cubrebocas, xlab="Busquedas de covid", ylab="Busquedas de cubrebocas")
abline(regresion)

  • Comparacion de proporciones de los datos
boxplot(busquedas$covid~busquedas$cubrebocas, col="pink")

*Análisis de tendencia central

summary(busquedas$covid)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   49.50   42.58   82.25  100.00
summary(busquedas$cubrebocas)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   7.500   6.404  11.000  21.000
  • Análisis de dispersion
sd(busquedas$covid)
## [1] 40.54547
sd(busquedas$cubrebocas)
## [1] 6.013904

¿Qué podemos concluir con esto?

Que las variables SI estan relacionadas, pero NO podemos inferir que existe aún una causalidad.

Caso de estudio 2

Reborn Live

¿Tienen relación las busquedas en todo el mundo de Reborn Live y AuronPlay?

Mi hipotesis nula es que SI tienen relación dado que la fama de Reborn Live se dio gracias a AuronPlay

  • Colectar datos
library(readr)
reb <- read_csv("reb.csv", col_types = cols(RebornLive = col_integer(), 
    AuronPlay = col_integer()))
head(reb)
## # A tibble: 6 x 2
##   RebornLive AuronPlay
##        <int>     <int>
## 1          1        24
## 2          0        26
## 3          0        27
## 4          0        24
## 5          1        26
## 6          0        27
  • ¿Están relacionados los datos?

Matriz de diagramas de dispersión

pairs(reb)

  • Matriz de coeficiente de correlación
cor(reb)
##            RebornLive AuronPlay
## RebornLive  1.0000000 0.6145259
## AuronPlay   0.6145259 1.0000000
  • Trazado de la recta de mínimos cuadrados
regresionreb <- lm(RebornLive~AuronPlay, data=reb)
summary(regresionreb)
## 
## Call:
## lm(formula = RebornLive ~ AuronPlay, data = reb)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.0570 -1.4266 -0.2581  1.3424  3.7038 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.19281    0.80787  -2.714  0.00909 ** 
## AuronPlay    0.07608    0.01381   5.508 1.26e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.724 on 50 degrees of freedom
## Multiple R-squared:  0.3776, Adjusted R-squared:  0.3652 
## F-statistic: 30.34 on 1 and 50 DF,  p-value: 1.259e-06
  • Ecuacion de la recta de mínimos cuadrados

\[ y=-2.19281+0.07608x \] * Trazado de la recta de mínimos cuadrados

plot(reb$AuronPlay, reb$RebornLive, xlab="Busquedas de AuronPlay", ylab="Busquedas de RebornLive")
abline(regresionreb)

  • Comparacion de proporciones de los datos
boxplot(reb$AuronPlay~reb$RebornLive, col="red")

*Análisis de tendencia central

summary(reb$AuronPlay)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   24.00   48.00   55.50   55.87   65.00  100.00
summary(reb$RebornLive)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   1.000   2.058   4.000   7.000
  • Análisis de dispersion
sd(reb$AuronPlay)
## [1] 17.47831
sd(reb$RebornLive)
## [1] 2.163996

¿Qué podemos concluir con esto?

Que las variables SI estan relacionadas, pero NO podemos inferir que existe aún una causalidad, ya que Reborn ya hacía streams antes y su fama ha ido creciendo gracias a su talento y la pasión que pone en cada stream, AuronPlay solo le dió el empujón que necesitaba.

#StanReborn