Asignación 2: Análisis Exploratorio de Datos

Los conteos de insectos en unidades experimentales agrícolas tratadas con diferentes insecticidas.

Imagen ilustrativa

Paquetes

library(pacman)
p_load("datasets","DT", "fdth", "prettydoc", "xfun")

Datos

data("InsectSprays")
dim(InsectSprays)
## [1] 72  2

Conociendo los datos, tabla interactiva

datatable(InsectSprays)

Contando los datos en sus clases

table(InsectSprays$count)
## 
##  0  1  2  3  4  5  6  7  9 10 11 12 13 14 15 16 17 19 20 21 22 23 24 26 
##  2  6  4  8  4  7  3  3  1  3  3  2  4  4  2  2  4  1  2  2  1  1  1  2

Conociendo las medidas de tendencia central

summary(InsectSprays)
##      count       spray 
##  Min.   : 0.00   A:12  
##  1st Qu.: 3.00   B:12  
##  Median : 7.00   C:12  
##  Mean   : 9.50   D:12  
##  3rd Qu.:14.25   E:12  
##  Max.   :26.00   F:12

Gráfico de caja y bigote

# boxplot para comparar los datos
boxplot(InsectSprays)
# Linea roja que reoresente la media del largo del pétalo
abline(h = mean(InsectSprays$count), col = "red")

Histograma

Histograma de frecuencias absolutas

hist(InsectSprays$count)

Histograma con granularidad de clases más distribuida

hist(InsectSprays$count, breaks = 100, col = "green")

Análisis de distribución de frecuencia, tablas e histogramas

Análisis para el conteo de uso de sprays

Tabla de frecuencias

tabla <- fdt(InsectSprays$count, breaks = "Sturges")

tabla
##     Class limits  f   rf rf(%) cf  cf(%)
##       [0,3.2825) 20 0.28 27.78 20  27.78
##   [3.2825,6.565) 14 0.19 19.44 34  47.22
##   [6.565,9.8475)  4 0.06  5.56 38  52.78
##   [9.8475,13.13) 12 0.17 16.67 50  69.44
##   [13.13,16.413)  8 0.11 11.11 58  80.56
##  [16.413,19.695)  5 0.07  6.94 63  87.50
##  [19.695,22.978)  5 0.07  6.94 68  94.44
##   [22.978,26.26)  4 0.06  5.56 72 100.00
#Donde 
#f = frecuencia absoluta
#fr = frecuencia relativa
#fr% = frecuencia relativa porcentual
#cf = frecuencia acumulada
#cf% = frecuencia acumulada porcentual

Histogramas

Histograma de frecuencia absoluta

plot(tabla, type = "fh")

Histograma de frecuencia relativa

plot(tabla, type = "rfh")

Histograma de frecuencia acumulada

plot(tabla, type = "cfh")

Poligonos

Poligono de frecuencia absoluta

plot(tabla, type="fp")

Poligono de frecuencia relativa

plot(tabla, type="rfh")

Poligono de frecuencia acumulada

plot(tabla, type = "cfp")

Medidas de dispersión

Varianza

var(InsectSprays$count)
## [1] 51.88732

Desviación estándar

sd(InsectSprays$count)
## [1] 7.203286

Gráfico de disperisón

plot(InsectSprays$count)

Descargas

Código

xfun::embed_file("ejercicio2.Rmd")

Download ejercicio2.Rmd