Inferencias estadísticas
Caso de estudio 1: ¿Las búsquedas en google de cubrebocas y COVID estan relacionadas? ¿Podemos inferir que existe una relación entre estas variables?
Para esto usaremos la herramienta google trends, para conocer la cantidad de busquedas en mexico en ambos temas. https://trends.google.com.mx/trends/explore?geo=MX&q=cubrebocas,COVID
Importar datos
library(readr)
covidCubreBocas <- read_csv("covidCubreBocas.csv",
col_types = cols(`cubrebocas: (México)` = col_number(),
`COVID: (México)` = col_number()))
head(covidCubreBocas)## # A tibble: 6 x 2
## `cubrebocas: (México)` `COVID: (México)`
## <dbl> <dbl>
## 1 0 0
## 2 0 0
## 3 0 0
## 4 0 0
## 5 0 0
## 6 0 0
¿existe la relación entre estos datos?
- primer ánalisis visual con una matriz de diagramas de dispersión
- Matriz de coeficientes de correlación
## cubrebocas: (México) COVID: (México)
## cubrebocas: (México) 1.0000000 0.9342247
## COVID: (México) 0.9342247 1.0000000
*Con esto inferimos que existe una correlación de 0.85 con respecto de las busquedas de covid y cubrebocas en Mexico para el año 2020
caso de estudio 2: ¿cómo varia el índice de esbeltez en pláantulas que fueron fertilizadas comparadas con plántulas que no fueron fertilizadas?
- Importar datos
## Parsed with column specification:
## cols(
## planta = col_double(),
## IE = col_double(),
## Tratamiento = col_character()
## )
- mostrar los datos en una tabla
| planta | IE | Tratamiento |
|---|---|---|
| 1 | 0.80 | Ctrl |
| 2 | 0.66 | Ctrl |
| 3 | 0.65 | Ctrl |
| 4 | 0.87 | Ctrl |
| 5 | 0.63 | Ctrl |
| 6 | 0.94 | Ctrl |
| 7 | 0.78 | Ctrl |
| 8 | 0.71 | Ctrl |
| 9 | 0.70 | Ctrl |
| 10 | 0.71 | Ctrl |
| 11 | 0.76 | Ctrl |
| 12 | 0.93 | Ctrl |
| 13 | 0.55 | Ctrl |
| 14 | 0.70 | Ctrl |
| 15 | 0.95 | Ctrl |
| 16 | 0.78 | Ctrl |
| 17 | 0.90 | Ctrl |
| 18 | 0.79 | Ctrl |
| 19 | 0.63 | Ctrl |
| 20 | 0.91 | Ctrl |
| 21 | 0.77 | Ctrl |
| 22 | 0.56 | Fert |
| 23 | 0.67 | Fert |
| 24 | 0.65 | Fert |
| 25 | 0.69 | Fert |
| 26 | 1.04 | Fert |
| 27 | 0.95 | Fert |
| 28 | 0.74 | Fert |
| 29 | 1.10 | Fert |
| 30 | 0.91 | Fert |
| 31 | 1.09 | Fert |
| 32 | 0.79 | Fert |
| 33 | 0.90 | Fert |
| 34 | 1.15 | Fert |
| 35 | 1.04 | Fert |
| 36 | 1.00 | Fert |
| 37 | 0.88 | Fert |
| 38 | 1.15 | Fert |
| 39 | 0.88 | Fert |
| 40 | 0.78 | Fert |
| 41 | 1.16 | Fert |
| 42 | 0.91 | Fert |
- Test de normalidad de shapiro wilk. este test se usa para constrarestar la normalidad de un conjunto de datos.
##
## Shapiro-Wilk normality test
##
## data: plantas$IE
## W = 0.96225, p-value = 0.1777
Error tipo I y error tipo II
$$ \[\begin{array}{l|l|l|c} \text{Conclusión} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]$$