Eficiencia energética de los edificios en aragón

Informe Estadístico

Author

Grupo 4

Municipio

Variable nominal

Estadística descriptiva

Buscamos el directorio de trabajo y cargamos la tabla de datos o el dataset:

#Buscar directorio de trabajo
setwd("~/INGENIERÍA AMBIENTAL/Semestre 3/Estadística y Probabilidad/Proyecto Eficiencia Energética Aragón/1.Datos")
#Cargar el conjunto de datos
library(readr)
datos <- read.csv("División zonales.csv", sep = ";",dec = ".")

Verificamos que rstudio nos lea correctamente los datos

str(datos)

'data.frame':   167442 obs. of  19 variables:
 $ fid                    : int  8 9 10 35 66 127 137 143 191 205 ...
 $ Día_Emisión            : int  4 14 14 19 3 24 7 22 20 26 ...
 $ Mes_Emisión            : int  11 11 11 2 6 11 1 5 11 2 ...
 $ Año_Emisión            : int  2013 2013 2013 2014 2014 2014 2015 2014 2013 2015 ...
 $ Emision_CO2            : chr  "55,7" "49,99" "59,68" "61,89" ...
 $ Clasificacion_Emisiones: chr  "E" "E" "E" "E" ...
 $ Demanda_energética     : chr  "275,06" "246,91" "294,64" "238,78" ...
 $ Clasificacion_consumo  : chr  "E" "E" "E" "E" ...
 $ Tipo_edificio          : chr  "Vivienda individual" "Vivienda individual" "Vivienda individual" "Vivienda individual" ...
 $ Estado_edificio        : chr  "Existente" "Existente" "Existente" "Existente" ...
 $ Anio_construccion      : int  2000 2000 2000 1900 2002 1940 2008 1977 1900 1940 ...
 $ Superficie_m2          : chr  "50,9" "69,96" "69,96" "143,5" ...
 $ Municipio              : chr  "LA PUEBLA DE HIJAR" "LA PUEBLA DE HIJAR" "LA PUEBLA DE HIJAR" "AZAILA" ...
 $ Provincia              : chr  "TERUEL" "TERUEL" "TERUEL" "TERUEL" ...
 $ Coordenadas._x         : chr  "714200,37" "714200,37" "714200,37" "709931,6" ...
 $ Coordenadas._y         : chr  "4566060,65" "4566060,65" "4566060,65" "4574178,7" ...
 $ Anio_emision           : int  2013 2013 2013 2014 2014 2014 2015 2014 2013 2015 ...
 $ Dias_hasta_expiracion  : int  3652 3652 3652 3652 3653 3653 3653 3653 3652 3653 ...
 $ Zona                   : chr  "Centro" "Centro" "Centro" "Centro" ...

Cargamos la variable

municipios<- datos$Zona

Debido a la cantidad de valores, agrupamos los municipios en zonas de acuerdo a la imagen 1:

Imagen 1. Divisiones zonales en la Comunidad autónoma de Aragón para agrupamiento de municipios.

Ahora creamos la tabla de frecuencias:

Tabla de frecuencias

tabla_municipios <- table(municipios)
TDF_municipios<- as.data.frame(tabla_municipios)

ni_municipios<-TDF_municipios$Freq
n<-sum(ni_municipios)
hi_municipios<-ni_municipios/n *100
hi_municipios

[1] 75.044493  2.480859 11.790351  6.028356  4.655941

sum(hi_municipios)

[1] 100

TDFfinal_municipios<-data.frame(TDF_municipios,round(hi_municipios,2))
colnames(TDFfinal_municipios)<- c("Municipios","ni","hi (%)")

library(knitr)

Warning: package 'knitr' was built under R version 4.4.2

kable(TDFfinal_municipios, format = "markdown", caption = "Tabla de Frecuencias")

Tabla de Frecuencias
Municipios	ni	hi (%)
Centro	125656	75.04
Este	4154	2.48
Norte	19742	11.79
Oeste	10094	6.03
Sur	7796	4.66

A continuación, las gráficas para variables cualitativas nominales.

Gráficas

Creamos el diagrama de barras con la frecuencia absoluta para visualizar el conteo de ocurrencias de los valores de la variable.

barplot(TDFfinal_municipios$ni, yaxt= "n", main = "Gráfica N°2.1.1.- Número edificios por municipios en
        la Comunidad Autónoma de Aragón",
        ylab="Cantidad",xlab = "Municipios",cex.names =0.8, names.arg = TDFfinal_municipios$Municipios,
        col = "brown", axis.lty = 1)
#ajustamos el eje y de notación científica a números enteros
eje_y2<-pretty(TDFfinal_municipios$ni)
axis(2, at=eje_y2, labels=format(eje_y2, scientific=FALSE))

################# Global
barplot(TDFfinal_municipios$ni, yaxt= "n", main = "Gráfica N°2.1.2.- Cantidad de edificios por municipios en
        la Comunidad Autónoma de Aragón (Global)",
        ylab="Cantidad",xlab = "Municipios",cex.names =0.8, names.arg = TDFfinal_municipios$Municipios,
        col = "brown", ylim = c(0,167479), axis.lty = 1)
#ajustamos el eje y de notación científica a números enteros
eje_y2.1<-pretty(c(0,167479))
axis(2, at=eje_y2.1, labels=format(eje_y2.1, scientific=FALSE))

Ahora, creamos el diagrama de barras con la frecuencia relativa para visualizar el porcentaje de ocurrencias de los valores.

barplot(TDFfinal_municipios$`hi (%)`,main = "Gráfica N°2.1.3.- Porcentaje de edificios por municipios en
        la Comunidad Autónoma de Aragón", ylab="Porcentaje (%)", 
        xlab = "Municipios",cex.names =0.8, names.arg = TDFfinal_municipios$Municipios,
        col = "purple2", axis.lty = 1)

barplot(TDFfinal_municipios$`hi (%)`,main = "Gráfica N°2.1.4.- Porcentaje de edificios por municipios en
        la Comunidad Autónoma de Aragón (Global)", ylab="Porcentaje (%)", 
        xlab = "Municipios",cex.names =0.8, names.arg = TDFfinal_municipios$Municipios,
        col = "purple2", ylim = c(0,100), axis.lty = 1)

El sector circular nos permite tener una mejor visualización del porcentaje de incidencia de un echo o fenómeno, usando la frecuencia relativa.

etiqueta2<-paste(TDFfinal_municipios$`hi (%)`,"%")
color2<-c(topo.colors(5))
pie(hi_municipios, radius = 1,labels = etiqueta2,
    col=color2, main= "Gráfica N°2.1.5.- Porcentaje de edificios por municipios en
        la Comunidad Autónoma de Aragón")
legend("bottomright",legend=TDFfinal_municipios$Municipios, fill=color2, title = "Leyenda",
       cex = 0.6, title.cex = 1)

Conclusiones

La variable municipio de los edificios en de la Comunidad Autónoma de Aragón, es de tipo nominal, donde el valor que más se repite es “Zaragosa”, sin embargo, para simplificación del análisis, se agrupo los municipios en zonas, en donde, la zona centro es la de mayor ocurrencia con un 72.04%.