Analisis exploratorio de datos e inferencia estadistica

Para este caso de estudio usaremos datos de un experimento hecho con plantulas en un invernadero de la UANL en el cual a un grupo de plantulas se les aplico fertilizante y a otro grupo no. El objetivo de esto es conocer que tan efectivo es el fertilizante par el desarrollo de las plantas.

¿Es efectivo el fertilizante? (NPK)

Importar Datos:

library(readr)
plantas <- read_csv("plantas.csv")
## Rows: 42 Columns: 3
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (1): Tratamiento
## dbl (2): planta, IE
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
head(plantas)
## # A tibble: 6 x 3
##   planta    IE Tratamiento
##    <dbl> <dbl> <chr>      
## 1      1  0.8  Ctrl       
## 2      2  0.66 Ctrl       
## 3      3  0.65 Ctrl       
## 4      4  0.87 Ctrl       
## 5      5  0.63 Ctrl       
## 6      6  0.94 Ctrl

Analisis exploratorio de datos:

Se generan 2 variables una para las plantulas que se les dió tratamiento y a las que no.

Ctrl <- subset(plantas, Tratamiento == "Ctrl")
Fert <- subset(plantas, Tratamiento == "Fert")

Histograma de frecuencia absoluta:

hist(Ctrl$IE)

# Sumario estadistico:

summary(Ctrl$IE)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.5500  0.7000  0.7700  0.7676  0.8700  0.9500

Grafico de caja y bigote:

boxplot(Ctrl$IE)

# ¿Que tan dispersos son los datos?

var(Ctrl$IE)
## [1] 0.01329905
sd(Ctrl$IE)
## [1] 0.1153215

Distribución de frecuencias:

library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
dist <- fdt(Ctrl$IE)
dist
##     Class limits f   rf rf(%) cf  cf(%)
##  [0.5445,0.6137) 1 0.05  4.76  1   4.76
##  [0.6137,0.6828) 4 0.19 19.05  5  23.81
##   [0.6828,0.752) 4 0.19 19.05  9  42.86
##   [0.752,0.8212) 6 0.29 28.57 15  71.43
##  [0.8212,0.8903) 1 0.05  4.76 16  76.19
##  [0.8903,0.9595) 5 0.24 23.81 21 100.00

Plantulas Fert:

Histograma:

hist(Fert$IE)

# Sumario estadistico:

summary(Fert$IE)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.5600  0.7800  0.9100  0.9067  1.0400  1.1600

Prueba de normalidad:

ks.test(Ctrl$IE, "pnorm", mean= mean(Ctrl$IE), sd=sd(Ctrl$IE))
## Warning in ks.test(Ctrl$IE, "pnorm", mean = mean(Ctrl$IE), sd = sd(Ctrl$IE)):
## ties should not be present for the Kolmogorov-Smirnov test
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  Ctrl$IE
## D = 0.11991, p-value = 0.9233
## alternative hypothesis: two-sided

¿Que tan dispersos son los datos de las plantulas ferilizadas?

var(Fert$IE)
## [1] 0.03238333
sd(Fert$IE)
## [1] 0.1799537

Prueba de normalidad para las plantulas fertilizadas:

ks.test(Fert$IE, "pnorm", mean= mean(Fert$IE), sd=sd(Fert$IE))
## Warning in ks.test(Fert$IE, "pnorm", mean = mean(Fert$IE), sd = sd(Fert$IE)):
## ties should not be present for the Kolmogorov-Smirnov test
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  Fert$IE
## D = 0.10776, p-value = 0.9677
## alternative hypothesis: two-sided

#Grafico de caja y bigote para plantulas fertilizadas:

ks.test(Fert$IE, "pnorm", mean= mean(Fert$IE), sd=sd(Fert$IE))
## Warning in ks.test(Fert$IE, "pnorm", mean = mean(Fert$IE), sd = sd(Fert$IE)):
## ties should not be present for the Kolmogorov-Smirnov test
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  Fert$IE
## D = 0.10776, p-value = 0.9677
## alternative hypothesis: two-sided

Conclusión.

¿Que tan diferentes son las poblaciones de FERT y CTRL?

Se muestra que las poblaciones si son diferentes, ya que las poblaciones controladas crecen de manera irregular, en cambio las plantulas que contienen ferilizante crecen de una manera más regular.

¿Podemos decir que el fertilizante es efectivo?

Si, ya que en las comparaciones se muestra que el uso de fertilizante las hace crecer de una manera más uniforme y rapida que las que son controladas y crecen de una manera muy variada.

¿Los datos son normales?

En los datos de las plantulas fertilizadas creo yo que son mas normales ya que se ve un crecimiento “parejo” y normal. En cambio las controladas es muy variado su crecimiento, por lo tanto no logro definir si es normal o anormal el crecimiento de estas.