Eficiencia energética de los edificios en Aragón

Informe estadístico

Author

Danny Jair Yaguana

Published

February 19, 2025

Clasificación de emisiones de CO2

Variable cualitativa ordinal

Se refiere a la categorización de los gases contaminantes liberados al ambiente según su origen, impacto y composición.

Estadística descriptiva

Buscamos el directorio de trabajo y cargamos la tabla de datos o el dataset:

#Buscar directorio de trabajo
setwd("~/INGENIERÍA AMBIENTAL/Semestre 3/Estadística y Probabilidad/Proyecto Eficiencia Energética Aragón/1.Datos")

#Cargar el conjunto de datos
library(readr)
datos <- read.csv("Edificios_Reales.csv", sep = ";",dec = ".")

Verificamos que rstudio nos lea correctamente los datos

str(datos)
'data.frame':   167479 obs. of  17 variables:
 $ Día_Emisión            : int  29 26 26 12 27 17 13 8 7 16 ...
 $ Mes_Emisión            : int  6 9 2 6 6 6 2 4 4 12 ...
 $ Año_Emisión            : int  2013 2013 2014 2013 2013 2013 2014 2014 2014 2013 ...
 $ Emision_CO2            : num  30.1 46.1 20.3 39.2 103.8 ...
 $ Clasificacion_Emisiones: chr  "E" "E" "D" "E" ...
 $ Demanda_energética     : num  142.3 174.4 94.2 187.7 409 ...
 $ Clasificacion_consumo  : chr  "E" "E" "D" "E" ...
 $ Tipo_edificio          : chr  "Vivienda individual" "Vivienda individual" "Vivienda individual" "Vivienda individual" ...
 $ Estado_edificio        : chr  "Existente" "Existente" "Existente" "Existente" ...
 $ Anio_construccion      : int  1962 1974 1999 1970 1965 1968 1966 1963 2006 1970 ...
 $ Superficie_m2          : num  49 81 72 65 46 ...
 $ Municipio              : chr  "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" ...
 $ Provincia              : chr  "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" ...
 $ Coordenadas._x         : num  674904 674063 671872 676129 674807 ...
 $ Coordenadas._y         : num  4612931 4612970 4612102 4613402 4613068 ...
 $ Anio_emision           : int  2013 2013 2014 2013 2013 2013 2014 2014 2014 2013 ...
 $ Dias_hasta_expiracion  : int  3652 3652 3652 3652 3652 3652 3652 3653 3653 3652 ...

Cargamos la variable

tipo_emision<- datos$Clasificacion_Emisiones

Verificamos el tamaño muestral

n<-length(tipo_emision)
n
[1] 167479

Ahora realizamos la tabla de frecuencias para conocer el comportamiento de la variable por medio de valores numéricos:

Tabla de frecuencias

tabla_tipo_emision <- table(tipo_emision)
TDF_tipo_emision<- as.data.frame(tabla_tipo_emision)

ni_tipo_emision<-TDF_tipo_emision$Freq
n<-sum(ni_tipo_emision)
hi_tipo_emision<-ni_tipo_emision/n *100

sum(hi_tipo_emision)
[1] 100
TDFfinal_tipo_emision<-data.frame(TDF_tipo_emision,round(hi_tipo_emision,2))
colnames(TDFfinal_tipo_emision)<- c("Clasificación de Emisiones","ni","hi (%)")


library(knitr)
Warning: package 'knitr' was built under R version 4.4.2
kable(TDFfinal_tipo_emision, format = "markdown", caption = "Tabla 1.Frecuencias de las categorías de la variable")
Tabla 1.Frecuencias de las categorías de la variable
Clasificación de Emisiones ni hi (%)
A 1814 1.08
B 2546 1.52
C 9408 5.62
D 22982 13.72
E 93885 56.06
F 19694 11.76
G 17150 10.24

Gráficas

Creamos el diagrama de barras con la frecuencia absoluta para visualizar el conteo de ocurrencias de los valores de la variable.

barplot(TDFfinal_tipo_emision$ni, main = "Gráfica N°4.1.1.- Número de edificios según su clasificación de emisiones en
        la Comunidad Autónoma de Aragón",
        ylab="Cantidad",xlab = "Clasificación de Emisiones",cex.names =0.8, names.arg = TDFfinal_tipo_emision$`Clasificación de Emisiones`,
        col = "gray",cex.main = 0.8)

################# Global
barplot(TDFfinal_tipo_emision$ni, main = "Gráfica N°4.1.2.- Número de edificios según su clasificación de emisiones en
        la Comunidad Autónoma de Aragón (Global)",
        ylab="Cantidad",xlab = "Clasificación de Emisiones",cex.names =0.8, names.arg = TDFfinal_tipo_emision$`Clasificación de Emisiones`,
        col = "gray", ylim = c(0,n),cex.main = 0.8)

Ahora, creamos el diagrama de barras con la frecuencia relativa para visualizar el porcentaje de ocurrencias de los valores.

barplot(TDFfinal_tipo_emision$`hi (%)`,main = "Gráfica N°4.1.3.- Porcentaje de edificios según su clasificación de emisiones en
        la Comunidad Autónoma de Aragón", ylab="Porcentaje (%)", 
        xlab = "Clasificación de Emisiones",cex.names =0.8, names.arg = TDFfinal_tipo_emision$`Clasificación de Emisiones`,
        col = "pink",cex.main = 0.8)

barplot(TDFfinal_tipo_emision$`hi (%)`,main = "Gráfica N°4.1.4.- Porcentaje de edificios según su clasificación de emisiones en
        la Comunidad Autónoma de Aragón (Global)", ylab="Porcentaje (%)", 
        xlab = "Clasificación de Emisiones",cex.names =0.8, names.arg = TDFfinal_tipo_emision$`Clasificación de Emisiones`,
        col = "pink", ylim = c(0,100),cex.main = 0.8)

Ahora, creamos el diagrama de sector circular porque nos permite una representación visual de las porciones relativas de los valores categóricos de la variable.

etiqueta5<-paste(TDFfinal_tipo_emision$`hi (%)`,"%")
color5<-c(topo.colors(7))
pie(hi_tipo_emision, radius = 1,labels = etiqueta5,
    col=color5, main= "Gráfica N°4.1.5.- Porcentaje de edificios según su clasificación de emisiones en
        la Comunidad Autónoma de Aragón", cex=0.8,cex.main = 0.8)
legend("bottomright",legend=TDFfinal_tipo_emision$`Clasificación de Emisiones`, fill=color5, title = "Leyenda",
       cex = 0.7, title.cex = 1)

Indicadores

Los indicadores estadísticos son valores que resumen, describen y analizan características de un conjunto de datos. Estos indicadores permiten simplificar y entender grandes volúmenes de información de manera más eficiente. Se utilizan para tomar decisiones informadas.

mediana<-median(tipo_emision)
mediana
[1] "E"
moda<-c("E")
moda
[1] "E"
Variable<-c("Clasificación de Emisiones")


Tabla_indicadores<-data.frame(Variable,mediana,moda)
colnames(Tabla_indicadores)<-c("Variable","Mediana","Moda")

library(knitr)
kable(Tabla_indicadores, format = "markdown", caption = "Tabla 2. Indicadores estadíticos de la variable Clasificación de Emisiones")
Tabla 2. Indicadores estadíticos de la variable Clasificación de Emisiones
Variable Mediana Moda
Clasificación de Emisiones E E

Conclusiones

La variable Clasificación de Emisiones presenta un valor central, la Categoria E, y el valor que más se repite es la Clasificación de tipo E que indica una emisión media entre 100% y 110% sobre la media siendo levemente perjudicial para el medio ambiente.