Ejercicio 2: EDA (Exploratory Data Analysis)
Utilizando el conjunto de datos conocido como “CO2 DATASET”
Experimento sobre la tolerancia al frío de la especie de pasto Echinochloa crus-galli.
Se midió la absorción de CO2 de seis plantas de Quebec y seis plantas de Mississippi a varios niveles de concentración ambiental de CO2. La mitad de las plantas de cada tipo se enfriaron durante la noche antes de realizar el experimento.
Echinochloa crus-galli
Paquetes
library(pacman)
p_load("datasets","DT", "fdth")
Datos
data("CO2")
dim(CO2)
## [1] 84 5
Conociendo los datos por medio de una tabla interactiva
datatable(CO2)
Contando los datos en sus clases
table(CO2$Plant)
##
## Qn1 Qn2 Qn3 Qc1 Qc3 Qc2 Mn3 Mn2 Mn1 Mc2 Mc3 Mc1
## 7 7 7 7 7 7 7 7 7 7 7 7
Medidas de tendencia central de conjunto de datos
summary(CO2)
## Plant Type Treatment conc uptake
## Qn1 : 7 Quebec :42 nonchilled:42 Min. : 95 Min. : 7.70
## Qn2 : 7 Mississippi:42 chilled :42 1st Qu.: 175 1st Qu.:17.90
## Qn3 : 7 Median : 350 Median :28.30
## Qc1 : 7 Mean : 435 Mean :27.21
## Qc3 : 7 3rd Qu.: 675 3rd Qu.:37.12
## Qc2 : 7 Max. :1000 Max. :45.50
## (Other):42
Ilustrando las MTC con un grafico de caja y bigote
boxplot(CO2)
#para dibujar una linea roja de la media del largo del pétalo
abline(h = mean(CO2$conc), col = "red")
Medidas de dispersión
Varianza
var(CO2$conc)
## [1] 87571.08
Desviación estandar
sd(CO2$conc)
## [1] 295.9241
Grafico de disperción
plot(CO2$uptake)
Tabla de frecuencia, histogramas y poligonos.
Tabla de frecuencia
tabla <- fdt(CO2$conc, breaks = "Sturges")
tabla
## Class limits f rf rf(%) cf cf(%)
## [94.05,208.5) 24 0.29 28.57 24 28.57
## [208.5,323) 12 0.14 14.29 36 42.86
## [323,437.5) 12 0.14 14.29 48 57.14
## [437.5,552) 12 0.14 14.29 60 71.43
## [552,666.5) 0 0.00 0.00 60 71.43
## [666.5,781) 12 0.14 14.29 72 85.71
## [781,895.5) 0 0.00 0.00 72 85.71
## [895.5,1010) 12 0.14 14.29 84 100.00
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual
Histograma de frecuencia absoluta
plot(tabla, type="fh")
Histograma de frecuencia relativa
plot(tabla, type="rfh")
Histograma de frecuencia acumulada
plot(tabla, type="cfh")
Poligono de frecuencia absoluta
plot(tabla, type="fp")
Poligono de frecuencia relativa
plot(tabla, type="rfp")
Poligono de frecuencia acumulada
plot(tabla, type="cfp")