Ejercicio 2: EDA (Exploratory Data Analysis)
##Utilizando el conjunto de datos conocido como “CO2 DATASET”
Carbon Dioxide Uptake in Grass Plants
Experimento sobre la tolerancia al frío de la especie de pasto Echinochloa crus-galli.
Se midió la absorción de CO2 de seis plantas de Quebec y seis plantas de Mississippi a varios niveles de concentración ambiental de CO2. La mitad de las plantas de cada tipo se enfriaron durante la noche antes de realizar el experimento.
Imagen Echinochloa crus-galli
Paquetes
library(pacman)
p_load("datasets","DT","fdth")Datos
data("CO2")
dim(CO2)## [1] 84 5
Conociendo los datos, tabla interactiva
datatable(CO2)Contando los datos en sus clases
table(CO2$Plant)##
## Qn1 Qn2 Qn3 Qc1 Qc3 Qc2 Mn3 Mn2 Mn1 Mc2 Mc3 Mc1
## 7 7 7 7 7 7 7 7 7 7 7 7
Conociendo las medidas de tendencia central y distribución del conjunto de datos
summary(CO2)## Plant Type Treatment conc uptake
## Qn1 : 7 Quebec :42 nonchilled:42 Min. : 95 Min. : 7.70
## Qn2 : 7 Mississippi:42 chilled :42 1st Qu.: 175 1st Qu.:17.90
## Qn3 : 7 Median : 350 Median :28.30
## Qc1 : 7 Mean : 435 Mean :27.21
## Qc3 : 7 3rd Qu.: 675 3rd Qu.:37.12
## Qc2 : 7 Max. :1000 Max. :45.50
## (Other):42
Gráfico de caja y bigote
# boxplot para comprar los datos
boxplot(CO2)
# Linea roja que representa la media de la altura.
abline(h = mean(CO2$conc), col= "red") ## Medidas de dispersión
Varianza
var(CO2)## Warning in stats::var(x, ...): NAs introducidos por coerción
## Plant Type Treatment conc uptake
## Plant NA NA NA NA NA
## Type NA NA NA NA NA
## Treatment NA NA NA NA NA
## conc NA NA NA 87571.084 1552.6867
## uptake NA NA NA 1552.687 116.9515
Desviación estándar
sd(CO2$conc)## [1] 295.9241
Gráfico de dispersión
plot(CO2$uptake) # Análisis de distribución de frecuencia, tablas e histogramas # Tabla de frecuencia
tabla <- fdt(CO2$conc, breaks = "Sturges")
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentualHistograma
Histograma de frecuencias absolutas
plot(tabla, type="fh")Histograma de frecuencia relativa
plot(tabla, type="rfh") Histograma de frecuencia relativa
plot(tabla, type="cfh")Polígonos
Polígonos de frecuencia absoluta
plot(tabla, type="fp") #### Polígonos de frecuencia relativa
plot(tabla, type="rfp")Polígonos de frencuencia acumulada
plot(tabla, type="cfp") ## Descarga este código
xfun::embed_file("A2U1.Rmd")