Inferencias estadísticas

Caso de estudio 1: ¿Las búsquedas en Google de cubrebocasy covid están relacionadas? ¿podemos inferir que existe una relación entre estas vriables?

Para este caso utiilizaremos la herrameinta de google trends, para conocer la cantidad de busquedas en México en ambos temas https://trends.google.com/trends/explore?geo=MX&q=covid,cubrebocas

  • Importar datos
library(readr)
covidCubreBocas <- read_csv("covidcubre.csv", 
    col_types = cols(`cubrebocas` = col_number(), 
        `covid` = col_number()))
head(covidCubreBocas)
## # A tibble: 6 x 2
##   cubrebocas covid
##        <dbl> <dbl>
## 1          1     0
## 2          1     0
## 3          1     0
## 4          1     0
## 5          8     3
## 6          4     3

Relacion entre los datos

Existe relación entre estos datos?

  • Primer análisis visual con una matríz de diagramas de dispersión

(covidCubreBocas)

  • Matríz de coeficientes de correlación
cor(covidCubreBocas)
##            cubrebocas     covid
## cubrebocas  1.0000000 0.8535324
## covid       0.8535324 1.0000000

Con esto inferimos que existe una correlación de 0.85 con respecto de las búsquedas de covid y cubrebocas en México para el año de 2020 de Febrero a Septiembre

Caso de estudio 2: ¿Cómo varía el índice de esbeltéz en plántulas que fueron fertilizadas comparadas con otras que no?

  • Importar datos
plantas <- read_csv("plantas.csv")
## Parsed with column specification:
## cols(
##   planta = col_double(),
##   IE = col_double(),
##   Tratamiento = col_character()
## )
#Análisis comparativo
boxplot(plantas$IE ~ plantas$Tratamiento, col = "red" )

Tabla de datos

  • Mostrar datos en una tabla
knitr::kable(plantas)
planta IE Tratamiento
1 0.80 Ctrl
2 0.66 Ctrl
3 0.65 Ctrl
4 0.87 Ctrl
5 0.63 Ctrl
6 0.94 Ctrl
7 0.78 Ctrl
8 0.71 Ctrl
9 0.70 Ctrl
10 0.71 Ctrl
11 0.76 Ctrl
12 0.93 Ctrl
13 0.55 Ctrl
14 0.70 Ctrl
15 0.95 Ctrl
16 0.78 Ctrl
17 0.90 Ctrl
18 0.79 Ctrl
19 0.63 Ctrl
20 0.91 Ctrl
21 0.77 Ctrl
22 0.56 Fert
23 0.67 Fert
24 0.65 Fert
25 0.69 Fert
26 1.04 Fert
27 0.95 Fert
28 0.74 Fert
29 1.10 Fert
30 0.91 Fert
31 1.09 Fert
32 0.79 Fert
33 0.90 Fert
34 1.15 Fert
35 1.04 Fert
36 1.00 Fert
37 0.88 Fert
38 1.15 Fert
39 0.88 Fert
40 0.78 Fert
41 1.16 Fert
42 0.91 Fert

Test de normalidad de Shapiro Wilk

  • Este test se usa para contrarrestar la normalidad de un conjunto de datos.
shapiro.test(plantas$IE)
## 
##  Shapiro-Wilk normality test
## 
## data:  plantas$IE
## W = 0.96225, p-value = 0.1777

Conclusión

Entre las busquedas de covid y cubrebocas hubo una correlacion de 0.8559244. Por otro lado pudimos ver que las plantas fertilizadas tienen un mayor nivel de esbeltez, era algo que podia esperarse pero lo vimos estadisticamente.