Eficiencia energética de los edificios en Aragón

Informe estadístico

Author

Danny Jair Yaguana

Published

February 19, 2025

Clasificación de consumo energético

Variable cualitativa ordinal

Es la división del uso de energía por los edificios según su origen, sector de aplicación o tipo de fuente energética

Estadística descriptiva

Buscamos el directorio de trabajo y cargamos la tabla de datos o el dataset:

setwd("~/INGENIERÍA AMBIENTAL/Semestre 3/Estadística y Probabilidad/Proyecto Eficiencia Energética Aragón")
library(readr)
datos <- read.csv("2.Doc´s/1. Variables Cualitativas/depuración variable clasificación de consumo.csv", sep = ";", dec = ".")

Verificamos que rstudio nos lea correctamente los datos

str(datos)
'data.frame':   167292 obs. of  1 variable:
 $ Clasificacion_consumo: chr  "E" "E" "D" "E" ...

Cargamos la variable

tipo_consumo<-datos$Clasificacion_consumo

Verificamos el nuevo tamaño muestral

n<-length(tipo_consumo)
n
[1] 167292

Ahora realizamos la tabla de frecuencias para conocer el comportamiento de la variable por medio de valores numéricos:

Tabla de frecuencias

tabla_tipo_consumo <- table(tipo_consumo)
TDF_tipo_consumo<- as.data.frame(tabla_tipo_consumo)

ni_tipo_consumo<-TDF_tipo_consumo$Freq
n<-sum(ni_tipo_consumo)
n
[1] 167292
hi_tipo_consumo<-ni_tipo_consumo/n *100
hi_tipo_consumo
[1]  0.871530  1.258877  4.136480 10.997537 55.394759 11.137412 16.203405
sum(hi_tipo_consumo)
[1] 100
TDFfinal_tipo_consumo<-data.frame(TDF_tipo_consumo,round(hi_tipo_consumo,2))
colnames(TDFfinal_tipo_consumo)<- c("Clasificación de Consumo Energético","ni","hi (%)")


library(knitr)
Warning: package 'knitr' was built under R version 4.4.2
kable(TDFfinal_tipo_consumo, format = "markdown", caption = "Tabla 1. Frecuencias de los valores de la variable")
Tabla 1. Frecuencias de los valores de la variable
Clasificación de Consumo Energético ni hi (%)
A 1458 0.87
B 2106 1.26
C 6920 4.14
D 18398 11.00
E 92671 55.39
F 18632 11.14
G 27107 16.20

Imagen 1.- Representación de las etiquetas de consumo energético. Obtenido de https://migrantesregulares.org/wp-content/uploads/eficiencia-energetica-del-refrigerador-768x518.jpg

Gráficas

Creamos el diagrama de barras con la frecuencia absoluta para visualizar el conteo de ocurrencias de los valores de la variable.

barplot(TDFfinal_tipo_consumo$ni, yaxt= "n", main = "Gráfica N°5.1.1.- Número de edificios según la clasificación de consumo energético en
        la Comunidad Autónoma de Aragón",
        ylab="Cantidad",xlab = "Clasificación de Consumo Energético",cex.names =0.8, names.arg = TDFfinal_tipo_consumo$`Clasificación de Consumo Energético`,
        col = "red3",cex.main = 0.8)
#ajustamos el eje y de notación científica a números enteros
eje_y6<-pretty(TDFfinal_tipo_consumo$ni)
axis(2, at=eje_y6, labels=format(eje_y6, scientific=FALSE))

barplot(TDFfinal_tipo_consumo$ni, yaxt= "n", main = "Gráfica N°5.1.2.- Número de edificios según la clasificación de consumo energético  en
        la Comunidad Autónoma de Aragón (Global)",
        ylab="Cantidad",xlab = "Clasificación de Consumo Energético",cex.names =0.8, names.arg = TDFfinal_tipo_consumo$`Clasificación de Consumo Energético`,
        col = "red3", ylim = c(0,n),cex.main = 0.8)
#ajustamos el eje y de notación científica a números enteros
eje_y6.1<-pretty(c(0,n))
axis(2, at=eje_y6.1, labels=format(eje_y6.1, scientific=FALSE))

Ahora, creamos el diagrama de barras con la frecuencia relativa para visualizar el porcentaje de ocurrencias de los valores.

barplot(TDFfinal_tipo_consumo$`hi (%)`,main = "Gráfica N°5.1.3.- Porcentaje de edificios según la clasificación de consumo energético  en
        la Comunidad Autónoma de Aragón", ylab="Porcentaje (%)", 
        xlab = "Clasificación de Consumo Energético",cex.names =0.8, names.arg = TDFfinal_tipo_consumo$`Clasificación de Consumo Energético`,
        col = "skyblue",cex.main = 0.8)

barplot(TDFfinal_tipo_consumo$`hi (%)`,main = "Gráfica N°5.1.4.- Porcentaje de edificios según la clasificación de consumo energético  en
        la Comunidad Autónoma de Aragón (Global)", ylab="Porcentaje (%)", 
        xlab = "Clasificación de Consumo Energético",cex.names =0.8, names.arg = TDFfinal_tipo_consumo$`Clasificación de Consumo Energético`,
        col = "skyblue", ylim = c(0,100),cex.main = 0.8)

Ahora, creamos el diagra de sector circular porque nos permite una representación visual de las porciones relativas de los valores categóricos de la variable.

etiqueta<-paste(TDFfinal_tipo_consumo$`hi (%)`,"%")
color<-c(topo.colors(8))
pie(hi_tipo_consumo, radius = 1,labels = etiqueta,
    col=color, main= "Gráfica N°5.1.2.- Porcentaje de edificios según la clasificación de consumo energético  en
        la Comunidad Autónoma de Aragón", cex=0.8,cex.main = 0.8)
legend("bottomright",legend=TDFfinal_tipo_consumo$`Clasificación de Consumo Energético`, fill=color, title = "Leyenda",
       cex = 0.7, title.cex = 1)

Indicadores

Los indicadores estadísticos son valores que resumen, describen y analizan características de un conjunto de datos. Estos indicadores permiten simplificar y entender grandes volúmenes de información de manera más eficiente. Se utilizan para tomar decisiones informadas.

mediana<-median(tipo_consumo)
Warning in mean.default(sort(x, partial = half + 0L:1L)[half + 0L:1L]):
argument is not numeric or logical: returning NA
mediana
[1] NA
moda<-c("E")
moda
[1] "E"
Variable<-c("Clasificación de Consumo")


Tabla_indicadores<-data.frame(Variable,mediana,moda)
colnames(Tabla_indicadores)<-c("Variable","Mediana","Moda")

library(knitr)
kable(Tabla_indicadores, format = "markdown", caption = "Tabla 2. Indicadores estadíticos de la variable Clasificación de Consumo")
Tabla 2. Indicadores estadíticos de la variable Clasificación de Consumo
Variable Mediana Moda
Clasificación de Consumo NA E

Conclusiones

La variable Clasificación de Consumo no presenta un valor central al ser el tamaño muestral par y ser de tipo cualitativa, y el valor que más se repite es la Clasificación de tipo E que indica un consumo medio entre 100% y 110% sobre la media siendo levemente perjudicial para el medio ambiente.