A2U1

Jorge Retamoza

2/2/2022

Ejercicio 2: EDA (Exploratory Data Analysis)

Utilizando el conjunto de datos conocido como “CO2 DATASET”

Experimento sobre la tolerancia al frío de la especie de pasto Echinochloa crus-galli.

Se midió la absorción de CO2 de seis plantas de Quebec y seis plantas de Mississippi a varios niveles de concentración ambiental de CO2. La mitad de las plantas de cada tipo se enfriaron durante la noche antes de realizar el experimento.

Echinochloa crus-galli

Paquetes

library(pacman)
p_load("datasets","DT", "fdth")

Datos

data("CO2")
dim(CO2)
## [1] 84  5

Conociendo los datos por medio de una tabla interactiva

datatable(CO2)

Contando los datos en sus clases

table(CO2$Plant)
## 
## Qn1 Qn2 Qn3 Qc1 Qc3 Qc2 Mn3 Mn2 Mn1 Mc2 Mc3 Mc1 
##   7   7   7   7   7   7   7   7   7   7   7   7

Medidas de tendencia central de conjunto de datos

summary(CO2)
##      Plant             Type         Treatment       conc          uptake     
##  Qn1    : 7   Quebec     :42   nonchilled:42   Min.   :  95   Min.   : 7.70  
##  Qn2    : 7   Mississippi:42   chilled   :42   1st Qu.: 175   1st Qu.:17.90  
##  Qn3    : 7                                    Median : 350   Median :28.30  
##  Qc1    : 7                                    Mean   : 435   Mean   :27.21  
##  Qc3    : 7                                    3rd Qu.: 675   3rd Qu.:37.12  
##  Qc2    : 7                                    Max.   :1000   Max.   :45.50  
##  (Other):42

Ilustrando las MTC con un grafico de caja y bigote

boxplot(CO2)
#para dibujar una linea roja de la media del largo del pétalo
abline(h = mean(CO2$conc), col = "red")

Medidas de dispersión

Varianza

var(CO2$conc)
## [1] 87571.08

Desviación estandar

sd(CO2$conc)
## [1] 295.9241

Grafico de disperción

plot(CO2$uptake)

Tabla de frecuencia, histogramas y poligonos.

Tabla de frecuencia

tabla <- fdt(CO2$conc, breaks = "Sturges")
tabla
##   Class limits  f   rf rf(%) cf  cf(%)
##  [94.05,208.5) 24 0.29 28.57 24  28.57
##    [208.5,323) 12 0.14 14.29 36  42.86
##    [323,437.5) 12 0.14 14.29 48  57.14
##    [437.5,552) 12 0.14 14.29 60  71.43
##    [552,666.5)  0 0.00  0.00 60  71.43
##    [666.5,781) 12 0.14 14.29 72  85.71
##    [781,895.5)  0 0.00  0.00 72  85.71
##   [895.5,1010) 12 0.14 14.29 84 100.00
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual

Histograma de frecuencia absoluta

plot(tabla, type="fh")

Histograma de frecuencia relativa

plot(tabla, type="rfh")

Histograma de frecuencia acumulada

plot(tabla, type="cfh")

Poligono de frecuencia absoluta

plot(tabla, type="fp")

Poligono de frecuencia relativa

plot(tabla, type="rfp")

Poligono de frecuencia acumulada

plot(tabla, type="cfp")