Ejercicio2

delPardoAntonio

03/02/2022

Ejercicio 2: EDA (Exploratory Data Analysis)

##Utilizando el conjunto de datos conocido como “CO2 DATASET”

Carbon Dioxide Uptake in Grass Plants

Experimento sobre la tolerancia al frío de la especie de pasto Echinochloa crus-galli.

Se midió la absorción de CO2 de seis plantas de Quebec y seis plantas de Mississippi a varios niveles de concentración ambiental de CO2. La mitad de las plantas de cada tipo se enfriaron durante la noche antes de realizar el experimento.

Imagen Echinochloa crus-galli

Paquetes

library(pacman)
p_load("datasets","DT","fdth")

Datos

data("CO2")
dim(CO2)
## [1] 84  5

Conociendo los datos, tabla interactiva

datatable(CO2)

Contando los datos en sus clases

table(CO2$Plant)
## 
## Qn1 Qn2 Qn3 Qc1 Qc3 Qc2 Mn3 Mn2 Mn1 Mc2 Mc3 Mc1 
##   7   7   7   7   7   7   7   7   7   7   7   7

Conociendo las medidas de tendencia central y distribución del conjunto de datos

summary(CO2)
##      Plant             Type         Treatment       conc          uptake     
##  Qn1    : 7   Quebec     :42   nonchilled:42   Min.   :  95   Min.   : 7.70  
##  Qn2    : 7   Mississippi:42   chilled   :42   1st Qu.: 175   1st Qu.:17.90  
##  Qn3    : 7                                    Median : 350   Median :28.30  
##  Qc1    : 7                                    Mean   : 435   Mean   :27.21  
##  Qc3    : 7                                    3rd Qu.: 675   3rd Qu.:37.12  
##  Qc2    : 7                                    Max.   :1000   Max.   :45.50  
##  (Other):42

Gráfico de caja y bigote

# boxplot para comprar los datos
boxplot(CO2)
# Linea roja que representa la media de la altura. 
abline(h = mean(CO2$conc), col= "red")

## Medidas de dispersión

Varianza

var(CO2)
## Warning in stats::var(x, ...): NAs introducidos por coerción
##           Plant Type Treatment      conc    uptake
## Plant        NA   NA        NA        NA        NA
## Type         NA   NA        NA        NA        NA
## Treatment    NA   NA        NA        NA        NA
## conc         NA   NA        NA 87571.084 1552.6867
## uptake       NA   NA        NA  1552.687  116.9515

Desviación estándar

sd(CO2$conc)
## [1] 295.9241

Gráfico de dispersión

plot(CO2$uptake)

# Análisis de distribución de frecuencia, tablas e histogramas # Tabla de frecuencia

tabla <- fdt(CO2$conc, breaks = "Sturges")

#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual

Histograma

Histograma de frecuencias absolutas

plot(tabla, type="fh")

Histograma de frecuencia relativa

plot(tabla, type="rfh")

Histograma de frecuencia relativa

plot(tabla, type="cfh")

Polígonos

Polígonos de frecuencia absoluta

plot(tabla, type="fp")

#### Polígonos de frecuencia relativa

plot(tabla, type="rfp")

Polígonos de frencuencia acumulada

plot(tabla, type="cfp")

## Descarga este código

xfun::embed_file("A2U1.Rmd")

Download A2U1.Rmd