Inferencias estadisticas
Caso de estudio 1: ¿Las busquedas en Google de cubrebocasy covid estan relacionadas? ¿podemos inferir que existe una relacion entre estas vriables?
Para este caso utiilizaremos la herrameinta de google trends, para conocer la cantidad de busquedas en México en ambos temas https://trends.google.com/trends/explore?geo=MX&q=covid,cubrebocas
- Importar datos
library(readr)
covidCubreBocas <- read_csv("covidCubreBocas.csv",
col_types = cols(`cubrebocas` = col_number(),
`covid` = col_number()))
head(covidCubreBocas)
## # A tibble: 6 x 2
## cubrebocas covid
## <dbl> <dbl>
## 1 1 0
## 2 1 0
## 3 1 0
## 4 1 0
## 5 8 3
## 6 4 3
Relacion entre los datos
Existe relacion entre estos datos?
- Primer analisis visual con una matriz de diagramas de dispersion
(covidCubreBocas)
- Matriz de coeficientes de correlacion
cor(covidCubreBocas)
## cubrebocas covid
## cubrebocas 1.0000000 0.8535324
## covid 0.8535324 1.0000000
Con esto inferimos que existe una correlacion de 0.85 con respecto de las busquedas de covid y cubrebocas en Mexico para el caso de 2020 de Febrero a Septiembre
Caso de estudio 2: ¿Como varia el indice de esbeltez en plantulas que fueron fertilizadas comparadas con otras que no?
- Importar datos
plantas <- read_csv("plantas.csv")
##
## -- Column specification ------------------------------------------------------------
## cols(
## planta = col_double(),
## IE = col_double(),
## Tratamiento = col_character()
## )
#Analisis comparativo
boxplot(plantas$IE ~ plantas$Tratamiento, col = "grey" )
Tabla de datos
- Mostrar datos en una tabla
knitr::kable(plantas)
planta | IE | Tratamiento |
---|---|---|
1 | 0.80 | Ctrl |
2 | 0.66 | Ctrl |
3 | 0.65 | Ctrl |
4 | 0.87 | Ctrl |
5 | 0.63 | Ctrl |
6 | 0.94 | Ctrl |
7 | 0.78 | Ctrl |
8 | 0.71 | Ctrl |
9 | 0.70 | Ctrl |
10 | 0.71 | Ctrl |
11 | 0.76 | Ctrl |
12 | 0.93 | Ctrl |
13 | 0.55 | Ctrl |
14 | 0.70 | Ctrl |
15 | 0.95 | Ctrl |
16 | 0.78 | Ctrl |
17 | 0.90 | Ctrl |
18 | 0.79 | Ctrl |
19 | 0.63 | Ctrl |
20 | 0.91 | Ctrl |
21 | 0.77 | Ctrl |
22 | 0.56 | Fert |
23 | 0.67 | Fert |
24 | 0.65 | Fert |
25 | 0.69 | Fert |
26 | 1.04 | Fert |
27 | 0.95 | Fert |
28 | 0.74 | Fert |
29 | 1.10 | Fert |
30 | 0.91 | Fert |
31 | 1.09 | Fert |
32 | 0.79 | Fert |
33 | 0.90 | Fert |
34 | 1.15 | Fert |
35 | 1.04 | Fert |
36 | 1.00 | Fert |
37 | 0.88 | Fert |
38 | 1.15 | Fert |
39 | 0.88 | Fert |
40 | 0.78 | Fert |
41 | 1.16 | Fert |
42 | 0.91 | Fert |
Test de normalidad de Shapiro Wilk
- Este test se usa para contrarrestar la normalidad de un conjunto de datos.
shapiro.test(plantas$IE)
##
## Shapiro-Wilk normality test
##
## data: plantas$IE
## W = 0.96225, p-value = 0.1777
Conclusion
Entre las busquedas de covid y cubrebocas hubo una correlacion de 0.8559244. Por otro lado pudimos ver que las plantas fertilizadas tienen un mayor nivel de esbeltez, era algo que podia esperarse pero lo vimos estadisticamente.