Diagrama de Pareto

Jonathan Martez

2024-08-26

Enunciado del problema

La administradora de la ciudad de Grove City, Utah, está preocupada por el consumo del agua, en particular en los hogares unifamiliares. Le gustaría desarrollar un plan para reducirlo. Para investigar este problema, selecciona una muestra de 100 hogares y determina el consumo normal de agua diario para diversos fines. Éstos son los resultados de la muestra.

Preguntas

¿Cuál es el área con mayor consumo?

¿Dónde debe concentrar sus esfuerzos para reducir el consumo de agua?

Carga e impresión de la tabla que utilizaremos para el diagrama

# En caso que no se tenga la librería readxl, se deberá instalar install.packages("readxl")
#Se carga la librerería para la lectura de arhivos de Excel
library(readxl)

#Creo una tabla con le información del archivo de excel
Tablas <- read_excel("Tablas.xlsx")

#Orden de mayor a menor frecuencia
Tablas <- Tablas[order(-Tablas$`Galones por día`), ]

#Se imprime las variables que están contenidad en el objeto Tablas
str(Tablas)
## tibble [8 × 2] (S3: tbl_df/tbl/data.frame)
##  $ Consumo de agua: chr [1:8] "Regar el jardín" "Baño personal" "Alberca" "Lavandería" ...
##  $ Galones por día: num [1:8] 143.7 106.7 28.3 24.9 12.3 ...

Se observa que esta tabla hay contenida dos variables, las cuales son Consumo de agua y Galones por día, la primera de estas es de tipo char y tiene ocho observaciones, la segunda es de tipo num y tiene 8 observaciones.

Creación del diagrama

# En caso que no se tenga la librería qcc, se deberá instalar install.packages("qcc")
#Se carga la librerería para realizar el gráfico
library(qcc)

#Creación del gráfico
pareto.chart(data = Tablas$`Galones por día`, 
             names.arg =Tablas$`Consumo de agua`, 
             ylab = "Frecuencia", 
             main = "Diagrama de Pareto",
             col = c("#d095ff", "#b482ff", "#986fff", "#7c5cff", "#6048ff", "#4435ff", "#2822ff", "#0c0fff"),
             las = 2,
             cex.names = 0.6)

##    
## Pareto chart analysis for Tablas$`Galones por día`
##      Frequency  Cum.Freq. Percentage Cum.Percent.
##   A 143.700000 143.700000  42.351901    42.351901
##   B 106.700000 250.400000  31.447097    73.798998
##   C  28.300000 278.700000   8.340701    82.139699
##   D  24.900000 303.600000   7.338638    89.478338
##   E  12.300000 315.900000   3.625111    93.103448
##   F  10.400000 326.300000   3.065134    96.168582
##   G   7.900000 334.200000   2.328323    98.496905
##   H   5.100000 339.300000   1.503095   100.000000

Respondiendo a las preguntas se pude decir que el área en el cual se concentra el mayor consumo de agua es Regar el jardín. Los esfuerzos para reducir el consumo de agua, se debe concentrar en regar el jardín y baño personal, ya que como vemos estos juntos conforman aproximadamente el 74% del consumo de agua.

Observación: para realizar el diagrama de pareto, los únicos parámetros estrictamente necesario son data y names.arg, el resto de parámetros se agregaron para simple estetica.