U1A9

Johana Dominguez

23/9/2020

Inferencias estadísticas

Caso de estudio 1: ¿la busquedas en google de cubrebocas y covid estan relacionadas? ¿podemos inferir que existe una relacion entre las variables?

#Importar datos

library(readr)
covidCubreBocas <- read_csv("covidCubreBocas.csv", 
    col_types = cols(`cubrebocas` = col_number(), 
        `covid` = col_number()))
head(covidCubreBocas)
## # A tibble: 6 x 2
##   cubrebocas covid
##        <dbl> <dbl>
## 1          1     0
## 2          1     0
## 3          1     0
## 4          1     0
## 5          8     3
## 6          4     3

¿existe la relación entre estos datos?

primer ánalisis visual con una matriz de diagramas de dispersión

pairs(covidCubreBocas)

Matriz de coeficientes de correlación

cor(covidCubreBocas)
##            cubrebocas     covid
## cubrebocas  1.0000000 0.8535324
## covid       0.8535324 1.0000000
  • con esto inferimos que existe una correlacion de 0.85 con respecto de las busquedas de covid y cubrebocas en mexico para el año 2020 de febrero a septiembre.

caso de studio 2: ¿como varia el indice de esbeltez en platulas que fuerin fertilizadas comparadas con platulas

  • importar datos
library(readr)
plantas <- read_csv("plantas.csv")
## Parsed with column specification:
## cols(
##   planta = col_double(),
##   IE = col_double(),
##   Tratamiento = col_character()
## )

analisis comparativo

boxplot(plantas$IE ~ plantas$Tratamiento, col = "grey")

  • mostrar los datos en una tabla.
knitr::kable(plantas)
planta IE Tratamiento
1 0.80 Ctrl
2 0.66 Ctrl
3 0.65 Ctrl
4 0.87 Ctrl
5 0.63 Ctrl
6 0.94 Ctrl
7 0.78 Ctrl
8 0.71 Ctrl
9 0.70 Ctrl
10 0.71 Ctrl
11 0.76 Ctrl
12 0.93 Ctrl
13 0.55 Ctrl
14 0.70 Ctrl
15 0.95 Ctrl
16 0.78 Ctrl
17 0.90 Ctrl
18 0.79 Ctrl
19 0.63 Ctrl
20 0.91 Ctrl
21 0.77 Ctrl
22 0.56 Fert
23 0.67 Fert
24 0.65 Fert
25 0.69 Fert
26 1.04 Fert
27 0.95 Fert
28 0.74 Fert
29 1.10 Fert
30 0.91 Fert
31 1.09 Fert
32 0.79 Fert
33 0.90 Fert
34 1.15 Fert
35 1.04 Fert
36 1.00 Fert
37 0.88 Fert
38 1.15 Fert
39 0.88 Fert
40 0.78 Fert
41 1.16 Fert
42 0.91 Fert
  • Test de normalidad de shapiro wilk. este test se usa para constrarestar la normalidad de un conjunto de datos.
shapiro.test(plantas$IE)
## 
##  Shapiro-Wilk normality test
## 
## data:  plantas$IE
## W = 0.96225, p-value = 0.1777
  • Conclusion.

REalizando un analisis de datos junto con diagramas de dispercion se llego a la conclusion que entre las busquedas de covid y cubrebocas hubo una correlacion de 0.8559244. En el segundo caso se pudo observar que las plantas fertilizadas tienen un mayor nivel de esbeltez