Inferencias estadísticas

caso de estudio 1

*¿La busquedas en google de cubrebocas y covid estan relacionadas? ,¿Podemos inferir que existe una relación entre las variables?

*Para este caso utilizaremos la herramienta de google trends, para conocer la cantidad de busquedas en México en ambos temas:

https://trends.google.com.mx/trends/explore?geo=MX&q=cubrebocas,COVID

  • Importación de datos
library(prettydoc)
library(readr)
covidCubreBocas <- read_csv("covidCubreBocas.csv", 
    col_types = cols(`cubrebocas` = col_number(), 
        `covid` = col_number()))
head(covidCubreBocas)
## # A tibble: 6 x 2
##   cubrebocas covid
##        <dbl> <dbl>
## 1          1     0
## 2          1     0
## 3          1     0
## 4          1     0
## 5          8     3
## 6          4     3

Relación entre los datos

  • ¿Existe la relación entre estos datos?

Primer ánalisis visual con una matriz de diagramas de dispersión

pairs(covidCubreBocas)

Matriz de coeficientes de correlación

cor(covidCubreBocas)
##            cubrebocas     covid
## cubrebocas  1.0000000 0.8535324
## covid       0.8535324 1.0000000
  • Con esto inferimos que existe una correlacion de 0.8535 con respecto de las busquedas de covid y cubrebocas en mexico para el año 2020 en el periodo de febrero a septiembre.

Caso de studio 2

¿Cómo varía el indice de esbeltez en plantulas que fueron fertilizadas comparadas con plantulas que no lo fueron?

*importación de datos

library(readr)
plantas <- read_csv("plantas.csv")
## Parsed with column specification:
## cols(
##   planta = col_double(),
##   IE = col_double(),
##   Tratamiento = col_character()
## )

Analisis comparativo

boxplot(plantas$IE ~ plantas$Tratamiento, col = "grey")

### Tabla de datos

  • Mostrar los datos en una tabla.
knitr::kable(plantas)
planta IE Tratamiento
1 0.80 Ctrl
2 0.66 Ctrl
3 0.65 Ctrl
4 0.87 Ctrl
5 0.63 Ctrl
6 0.94 Ctrl
7 0.78 Ctrl
8 0.71 Ctrl
9 0.70 Ctrl
10 0.71 Ctrl
11 0.76 Ctrl
12 0.93 Ctrl
13 0.55 Ctrl
14 0.70 Ctrl
15 0.95 Ctrl
16 0.78 Ctrl
17 0.90 Ctrl
18 0.79 Ctrl
19 0.63 Ctrl
20 0.91 Ctrl
21 0.77 Ctrl
22 0.56 Fert
23 0.67 Fert
24 0.65 Fert
25 0.69 Fert
26 1.04 Fert
27 0.95 Fert
28 0.74 Fert
29 1.10 Fert
30 0.91 Fert
31 1.09 Fert
32 0.79 Fert
33 0.90 Fert
34 1.15 Fert
35 1.04 Fert
36 1.00 Fert
37 0.88 Fert
38 1.15 Fert
39 0.88 Fert
40 0.78 Fert
41 1.16 Fert
42 0.91 Fert

Test de normalidad de shapiro wilk

Este test se usa para constrarrestar la normalidad de un conjunto de datos.

shapiro.test(plantas$IE)
## 
##  Shapiro-Wilk normality test
## 
## data:  plantas$IE
## W = 0.96225, p-value = 0.1777

Conclusion.

Para el primer caso en el que se relacionan las búsquedas de COVID y cubrebocas ; mediante el análisis realizado se puede observar que efectivamente existe una correlación entra ambos ya que se obtuvo un coeficiente de correlación de 0.85. Para el caso de las plantas que fueron o no fertilizadas , aquellas que si lo fueron presentaron un mayor índice de esbeltez , y esto se podía intuir previamente , y tambien al ver la tabla de resultados, pero el analisis realizado nos permitió comprender , que tan cercana es esta relación en estas variables.