U1A12

Isabel Valenzuela

25/9/2020

Inferencia estadística

Caso de estudio 1

Busquedas de covid y cubrebocas

¿Tienen relación las búsquedas en México de cubrebocas y covid?

Mi hipótesis nula es que SI tienen relación dado que cuando existe un interés de búsqueda en covid, la gente también buscar informarse de cubrebocas

  • Colectar datos
library(pacman)
p_load("readr","DT")
busquedas <- read_csv("busquedas.csv", col_types = cols(covid = col_number(), cubrebocas = col_number()))
View (busquedas)
head(busquedas)
## # A tibble: 6 x 2
##   covid cubrebocas
##   <dbl>      <dbl>
## 1     0          0
## 2     0          0
## 3     0          0
## 4     0          0
## 5     0          0
## 6     0          0
  • ¿Están relacionados los datos?

Matriz de diagramas de dispersión

pairs(busquedas)

  • Matriz de coeficientes de correlación
cor(busquedas)
##                covid cubrebocas
## covid      1.0000000  0.9356061
## cubrebocas 0.9356061  1.0000000
  • Recta de mínimos cuadrados
regresion <- lm(cubrebocas~covid, data=busquedas)
summary(regresion)
## 
## Call:
## lm(formula = cubrebocas ~ covid, data = busquedas)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.8747 -1.2513 -0.4953  0.5047  7.0884 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 0.495288   0.433409   1.143    0.259    
## covid       0.138774   0.007406  18.739   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.144 on 50 degrees of freedom
## Multiple R-squared:  0.8754, Adjusted R-squared:  0.8729 
## F-statistic: 351.2 on 1 and 50 DF,  p-value: < 2.2e-16
  • Ecuación de la recta de mínimos cuadrados

\[y = 0.495288 + 0.138774x\]

  • Trazado de la recta de mínimos cuadrados
plot(busquedas$covid, busquedas$cubrebocas, xlab="busquedas de covid", ylab="busquedas de cubrebocas")
abline(regresion)

  • Comparación de proporciones de los datos
boxplot(busquedas$covid ~ busquedas$cubrebocas, col="grey")

  • Análisis de tendencia central
summary(busquedas$covid)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   49.50   42.58   82.25  100.00
summary(busquedas$cubrebocas)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   7.500   6.404  11.000  21.000

*Análisis de dispersión

sd(busquedas$covid)
## [1] 40.54547
sd(busquedas$cubrebocas)
## [1] 6.013904

¿Qué podemos concluir con esto?

Que las variables SI están relacionadas, pero no podemos inferir que existe aún una causalidad.

Caso de estudio 2

¿Se relacionarán las búsquedas de celulares nuevos y las de cristal templado en México? Celulares con cristal templado

Mi hipótesis nula es que SI tienen relación debido a que cuando una persona adquiere un celular nuevo, también desea adquirir protección para el cuidado de su celular

  • Colectar datos
busquedas2 <- read_csv("celularescristal.csv", col_types = cols(celulares = col_number(), cristal = col_number()))
View (busquedas2)
head(busquedas2)
## # A tibble: 6 x 2
##   celulares cristal
##       <dbl>   <dbl>
## 1        22      48
## 2        22      65
## 3        20      70
## 4        22      53
## 5        20      54
## 6        38      67
  • ¿Están relacionados los datos?

Matriz de diagramas de dispersión

pairs(busquedas2)

  • Matriz de coeficientes de correlación
cor(busquedas2)
##           celulares   cristal
## celulares 1.0000000 0.4970454
## cristal   0.4970454 1.0000000
  • Recta de mínimos cuadrados
regresion <- lm(celulares~cristal, data=busquedas2)
summary(regresion)
## 
## Call:
## lm(formula = celulares ~ cristal, data = busquedas2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -13.6818  -3.7396  -0.0605   2.8919  14.0754 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  7.65851    4.22699   1.812 0.076024 .  
## cristal      0.24278    0.05994   4.050 0.000178 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.848 on 50 degrees of freedom
## Multiple R-squared:  0.2471, Adjusted R-squared:  0.232 
## F-statistic: 16.41 on 1 and 50 DF,  p-value: 0.000178
  • Ecuación de la recta de mínimos cuadrados

\[y = 7.65851 + 0.24278x\]

  • Trazado de la recta de mínimos cuadrados
plot(busquedas2$cristal, busquedas2$celulares, xlab="busquedas de  cristal templado", ylab="busquedas de  celulares nuevos")
abline(regresion)

  • Comparación de proporciones de los datos
boxplot(busquedas2$cristal ~ busquedas2$celulares, col="grey")

  • Análisis de tendencia central
summary(busquedas2$cristal)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   33.00   59.75   67.50   69.21   77.00  100.00
summary(busquedas2$celulares)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   10.00   20.00   23.00   24.46   27.25   39.00

*Análisis de dispersión

sd(busquedas2$cristal)
## [1] 13.66165
sd(busquedas2$celulares)
## [1] 6.672923

¿Qué podemos concluir con esto?

Que tienen una correlación baja, aunque pareciera que ambas serían causales; no se puede deducir que ambas estén altamente relacionas en las búsquedas.

Redacción personal

En el caso #2 las variables tiene una correlacion del 0.49, podría denotarse un poco baja en comparación a la del covid y cubrebocas . Sin embargo se manifiesta una causalidad ya que es común que una persona que adquiera un celular nueva quiera tener una precaución y tambien busque cristal templado, pero se descartan muchas opciones, como la de alguien que solo le interese el cristal aunque su celular no sea nuevo.