Inferencias estadísticas

Caso de estudio 1: ¿Las búsquedas en google de cubrebocas y COVID estan relacionadas? ¿Podemos inferir que existe una relación entre estas variables?

library(readr)
covidCubreBocas <- read_csv("covidCubreBocas.csv", 
    col_types = cols(`cubrebocas: (México)` = col_number(), 
        `COVID: (México)` = col_number()))
head(covidCubreBocas)
## # A tibble: 6 x 2
##   `cubrebocas: (México)` `COVID: (México)`
##                    <dbl>             <dbl>
## 1                      0                 0
## 2                      0                 0
## 3                      0                 0
## 4                      0                 0
## 5                      0                 0
## 6                      0                 0

¿existe la relación entre estos datos?

  • primer ánalisis visual con una matriz de diagramas de dispersión
pairs(covidCubreBocas)

  • Matriz de coeficientes de correlación
cor(covidCubreBocas)
##                      cubrebocas: (México) COVID: (México)
## cubrebocas: (México)            1.0000000       0.9342247
## COVID: (México)                 0.9342247       1.0000000

*Con esto inferimos que existe una correlación de 0.85 con respecto de las busquedas de covid y cubrebocas en Mexico para el año 2020

caso de estudio 2: ¿cómo varia el índice de esbeltez en pláantulas que fueron fertilizadas comparadas con plántulas que no fueron fertilizadas?

  • Importar datos
library(readr)
plantas <- read_csv("plantas.csv")
## Parsed with column specification:
## cols(
##   planta = col_double(),
##   IE = col_double(),
##   Tratamiento = col_character()
## )
#analisis comparativo 
boxplot(plantas$IE ~ plantas$Tratamiento, col = "grey")

  • mostrar los datos en una tabla
knitr::kable(plantas)
planta IE Tratamiento
1 0.80 Ctrl
2 0.66 Ctrl
3 0.65 Ctrl
4 0.87 Ctrl
5 0.63 Ctrl
6 0.94 Ctrl
7 0.78 Ctrl
8 0.71 Ctrl
9 0.70 Ctrl
10 0.71 Ctrl
11 0.76 Ctrl
12 0.93 Ctrl
13 0.55 Ctrl
14 0.70 Ctrl
15 0.95 Ctrl
16 0.78 Ctrl
17 0.90 Ctrl
18 0.79 Ctrl
19 0.63 Ctrl
20 0.91 Ctrl
21 0.77 Ctrl
22 0.56 Fert
23 0.67 Fert
24 0.65 Fert
25 0.69 Fert
26 1.04 Fert
27 0.95 Fert
28 0.74 Fert
29 1.10 Fert
30 0.91 Fert
31 1.09 Fert
32 0.79 Fert
33 0.90 Fert
34 1.15 Fert
35 1.04 Fert
36 1.00 Fert
37 0.88 Fert
38 1.15 Fert
39 0.88 Fert
40 0.78 Fert
41 1.16 Fert
42 0.91 Fert
  • Test de normalidad de shapiro wilk. este test se usa para constrarestar la normalidad de un conjunto de datos.
shapiro.test(plantas$IE)
## 
##  Shapiro-Wilk normality test
## 
## data:  plantas$IE
## W = 0.96225, p-value = 0.1777

Error tipo I y error tipo II

$$ \[\begin{array}{l|l|l|c} \text{Conclusión} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]

$$