Ejercicio: EDA (Exploratorio data analisis)
Utilizando el conjunto datos conocido como “CO2”
Se mide la absorción de dioxido de carbono CO2 de seis plantas de Quebec y seis plantas de Mississippi a varios niveles de concentración ambiental de CO2. La mitad de las plantas de cada tipo se enfriaron durante la noche antes de realizar el experimento.
ILUSTRACION
Paquetes
library(pacman)
p_load("datasets","DT","fdth")Datos
data("CO2")
dim(CO2)## [1] 84 5
Teniendo los datos
datatable(CO2)Contando los datos en sus clases
table(CO2$Type)##
## Quebec Mississippi
## 42 42
Medidas de tendencia central
summary(CO2)## Plant Type Treatment conc uptake
## Qn1 : 7 Quebec :42 nonchilled:42 Min. : 95 Min. : 7.70
## Qn2 : 7 Mississippi:42 chilled :42 1st Qu.: 175 1st Qu.:17.90
## Qn3 : 7 Median : 350 Median :28.30
## Qc1 : 7 Mean : 435 Mean :27.21
## Qc3 : 7 3rd Qu.: 675 3rd Qu.:37.12
## Qc2 : 7 Max. :1000 Max. :45.50
## (Other):42
boxplot(CO2)boxplot(CO2$uptake)
# para dibujar la media
abline(h = mean(CO2$uptake), col = "red")Medidas de dispersion
Varianza
var(CO2$uptake)## [1] 116.9515
Desviacion estandar
sd(CO2$uptake)## [1] 10.81441
Tabla de frecuencia
tabla <- fdt(CO2$uptake, breaks = "Sturges")
tabla## Class limits f rf rf(%) cf cf(%)
## [7.623,12.415) 9 0.11 10.71 9 10.71
## [12.415,17.206) 10 0.12 11.90 19 22.62
## [17.206,21.998) 13 0.15 15.48 32 38.10
## [21.998,26.789) 5 0.06 5.95 37 44.05
## [26.789,31.581) 13 0.15 15.48 50 59.52
## [31.581,36.372) 12 0.14 14.29 62 73.81
## [36.372,41.163) 13 0.15 15.48 75 89.29
## [41.163,45.955) 9 0.11 10.71 84 100.00
Histogramas
Histogramas de frecuencia absoluta
plot(tabla, type="fh")Frecuencia acumulada
plot(tabla, type="cfh")Poligonos
Poligonos de frecuencia absoluta
plot(tabla, type="fp")Poligonos de frecuencia relativa
plot(tabla, type="rfp")Poligonos de frecuencia acumulada
plot(tabla, type="cfp")