Analisis exploratorio de plantas e inferencia estadistica
Para este caso de estudio usaremos datos de un experimento hecho con plantulas en un invernadero de la UANL en el cual a un grupo de plantulas se les aplico fertilizante y a otro grupo no. El objetivo de esto es conocer que tan efectivo es el fertilizante par el desarrollo de las plantas.
Es efectivo el fertilizante? (NPK)
importamos datos
library(readr)
plantas <- read_csv("docs/plantas.csv",show_col_types = FALSE)head(plantas)## # A tibble: 6 x 3
## planta IE Tratamiento
## <dbl> <dbl> <chr>
## 1 1 0.8 Ctrl
## 2 2 0.66 Ctrl
## 3 3 0.65 Ctrl
## 4 4 0.87 Ctrl
## 5 5 0.63 Ctrl
## 6 6 0.94 Ctrl
Analisis exploratorio de datos.
Aqui generaremos 2 variables, una llamada Fert para los datos de plantulas a las cuales se les dio un tratamiento con NPK y otra llamada Ctrl para las plantas control, o grupo blanco.
Ctrl <- subset(plantas, Tratamiento == "Ctrl")
Fert <- subset(plantas, Tratamiento == "Fert")Histograma de frecuencia absoluta.
- Grupo de control
hist(Ctrl$IE,col = "#0074BC")- Sumario Estadistico
summary(Ctrl$IE)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.5500 0.7000 0.7700 0.7676 0.8700 0.9500
- Grafico caja y bigote
boxplot(Ctrl$IE, col = "#0074BC")- Varianza y desviacion estandar. ¿Que tan dispersos o variables son los datos?
var(Ctrl$IE)## [1] 0.01329905
sd(Ctrl$IE)## [1] 0.1153215
- Tabla de distribucion de frecuencias
library(fdth)##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
dist <- fdt(Ctrl$IE)
dist## Class limits f rf rf(%) cf cf(%)
## [0.5445,0.6137) 1 0.05 4.76 1 4.76
## [0.6137,0.6828) 4 0.19 19.05 5 23.81
## [0.6828,0.752) 4 0.19 19.05 9 42.86
## [0.752,0.8212) 6 0.29 28.57 15 71.43
## [0.8212,0.8903) 1 0.05 4.76 16 76.19
## [0.8903,0.9595) 5 0.24 23.81 21 100.00
Para poder llegar a una conclusion al respecto de los datos, necesitamos saber si esta “efectividad” del fertilizante SI es representativa para la mayoria de los datos. Una forma de saber esto es determinar si la distribucion de los datos es NORMAL o no.
Para esto tenemos las pruebas de normalidad:
- Kolmogorov-Smirnov
- Shapiro-Wilk
Prueba de normalidad de Kolmogorov-Smirnov
ks.test(Ctrl$IE, "pnorm", mean= mean(Ctrl$IE), sd=sd(Ctrl$IE))## Warning in ks.test(Ctrl$IE, "pnorm", mean = mean(Ctrl$IE), sd = sd(Ctrl$IE)):
## ties should not be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: Ctrl$IE
## D = 0.11991, p-value = 0.9233
## alternative hypothesis: two-sided
Histograma de frecuencia absoluta.
- Grupo Fertilizante
hist(Fert$IE,col = "#0074BC" )summary(Fert$IE)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.5600 0.7800 0.9100 0.9067 1.0400 1.1600
- Varianza y desviacion estandar. FERT
var(Fert$IE)## [1] 0.03238333
sd(Fert$IE)## [1] 0.1799537
- Grafico de Caja y bigote.
boxplot(Fert$IE,col = "#0074BC")- Tabla de distribuicion de frecuencias de Grupo Fert.
dist2 <- fdt(Fert$IE)
dist2## Class limits f rf rf(%) cf cf(%)
## [0.5544,0.6573) 2 0.10 9.52 2 9.52
## [0.6573,0.7601) 3 0.14 14.29 5 23.81
## [0.7601,0.863) 2 0.10 9.52 7 33.33
## [0.863,0.9659) 6 0.29 28.57 13 61.90
## [0.9659,1.069) 3 0.14 14.29 16 76.19
## [1.069,1.172) 5 0.24 23.81 21 100.00
- Prueba de normalidad de Kolmogorov-Smirnov
ks.test(Fert$IE, "pnorm", mean= mean(Fert$IE), sd=sd(Fert$IE))## Warning in ks.test(Fert$IE, "pnorm", mean = mean(Fert$IE), sd = sd(Fert$IE)):
## ties should not be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: Fert$IE
## D = 0.10776, p-value = 0.9677
## alternative hypothesis: two-sided
shapiro.test(Fert$IE)##
## Shapiro-Wilk normality test
##
## data: Fert$IE
## W = 0.95339, p-value = 0.3941
shapiro.test(Ctrl$IE)##
## Shapiro-Wilk normality test
##
## data: Ctrl$IE
## W = 0.9532, p-value = 0.3908
¿Que tan diferentes son las poblaciones de FERT y CTRL?
Podemos decir que son muy diferentes, se observa en los histogramas que la poblacion FERT se torna mas uniforme que la poblacion CTRL. Además los datos se alejan de la media y varian mas en la poblacion de las plantulas CRTL
¿Podemos decir que el fertilzante es efectivo?
Si podemos decir que el fertilizante es efectivo, ya que fue comprobado con las diferentes operaciones que se realizaron en este ejercicio. En concreto con el uso del fertilizante se obtuvieron plantulas de similares tamaños.
¿Los datos son normales?
De acuerdo a la prueba (K-S) No podemos concluir si son normales o no ya que son pocos datos para hacer contraste con la hipotesis, esto de acuerdo a las pruebas de normalidad. Sin embargo a simple vista noto que los elementos FERT son normales a comparacion de CTRL debido a que varian demasiado.
Referencias. Prueba de Kolmogorov – Smirnoff (K-S) Interpretar todos los estadísticos y gráficas para Prueba de normalidad