Asignación 2: Análisis Exploratorio de Datos
Los conteos de insectos en unidades experimentales agrícolas tratadas con diferentes insecticidas.
Imagen ilustrativa
Paquetes
library(pacman)
p_load("datasets","DT", "fdth", "prettydoc", "xfun")Datos
data("InsectSprays")
dim(InsectSprays)## [1] 72 2
Conociendo los datos, tabla interactiva
datatable(InsectSprays)Contando los datos en sus clases
table(InsectSprays$count)##
## 0 1 2 3 4 5 6 7 9 10 11 12 13 14 15 16 17 19 20 21 22 23 24 26
## 2 6 4 8 4 7 3 3 1 3 3 2 4 4 2 2 4 1 2 2 1 1 1 2
Conociendo las medidas de tendencia central
summary(InsectSprays)## count spray
## Min. : 0.00 A:12
## 1st Qu.: 3.00 B:12
## Median : 7.00 C:12
## Mean : 9.50 D:12
## 3rd Qu.:14.25 E:12
## Max. :26.00 F:12
Gráfico de caja y bigote
# boxplot para comparar los datos
boxplot(InsectSprays)
# Linea roja que reoresente la media del largo del pétalo
abline(h = mean(InsectSprays$count), col = "red")Histograma
Histograma de frecuencias absolutas
hist(InsectSprays$count)Histograma con granularidad de clases más distribuida
hist(InsectSprays$count, breaks = 100, col = "green")Análisis de distribución de frecuencia, tablas e histogramas
Análisis para el conteo de uso de sprays
Tabla de frecuencias
tabla <- fdt(InsectSprays$count, breaks = "Sturges")
tabla## Class limits f rf rf(%) cf cf(%)
## [0,3.2825) 20 0.28 27.78 20 27.78
## [3.2825,6.565) 14 0.19 19.44 34 47.22
## [6.565,9.8475) 4 0.06 5.56 38 52.78
## [9.8475,13.13) 12 0.17 16.67 50 69.44
## [13.13,16.413) 8 0.11 11.11 58 80.56
## [16.413,19.695) 5 0.07 6.94 63 87.50
## [19.695,22.978) 5 0.07 6.94 68 94.44
## [22.978,26.26) 4 0.06 5.56 72 100.00
#Donde
#f = frecuencia absoluta
#fr = frecuencia relativa
#fr% = frecuencia relativa porcentual
#cf = frecuencia acumulada
#cf% = frecuencia acumulada porcentualHistogramas
Histograma de frecuencia absoluta
plot(tabla, type = "fh")Histograma de frecuencia relativa
plot(tabla, type = "rfh")Histograma de frecuencia acumulada
plot(tabla, type = "cfh")Poligonos
Poligono de frecuencia absoluta
plot(tabla, type="fp")Poligono de frecuencia relativa
plot(tabla, type="rfh")Poligono de frecuencia acumulada
plot(tabla, type = "cfp")Medidas de dispersión
Varianza
var(InsectSprays$count)## [1] 51.88732
Desviación estándar
sd(InsectSprays$count)## [1] 7.203286
Gráfico de disperisón
plot(InsectSprays$count)