Eficiencia energética de los edificios en aragón

Informe Estadístico

Author

Grupo 4

Provincia

Variable nominal

Estadística descriptiva

Buscamos el directorio de trabajo y cargamos la tabla de datos o el dataset:

#Buscar directorio de trabajo
setwd("~/INGENIERÍA AMBIENTAL/Semestre 3/Estadística y Probabilidad/Proyecto Eficiencia Energética Aragón/1.Datos")
#Cargar el conjunto de datos
library(readr)
datos <- read.csv("Edificios_Reales.csv", sep = ";",dec = ".")

Verificamos que rstudio nos lea correctamente los datos

str(datos)
'data.frame':   167479 obs. of  17 variables:
 $ Día_Emisión            : int  29 26 26 12 27 17 13 8 7 16 ...
 $ Mes_Emisión            : int  6 9 2 6 6 6 2 4 4 12 ...
 $ Año_Emisión            : int  2013 2013 2014 2013 2013 2013 2014 2014 2014 2013 ...
 $ Emision_CO2            : num  30.1 46.1 20.3 39.2 103.8 ...
 $ Clasificacion_Emisiones: chr  "E" "E" "D" "E" ...
 $ Demanda_energética     : num  142.3 174.4 94.2 187.7 409 ...
 $ Clasificacion_consumo  : chr  "E" "E" "D" "E" ...
 $ Tipo_edificio          : chr  "Vivienda individual" "Vivienda individual" "Vivienda individual" "Vivienda individual" ...
 $ Estado_edificio        : chr  "Existente" "Existente" "Existente" "Existente" ...
 $ Anio_construccion      : int  1962 1974 1999 1970 1965 1968 1966 1963 2006 1970 ...
 $ Superficie_m2          : num  49 81 72 65 46 ...
 $ Municipio              : chr  "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" ...
 $ Provincia              : chr  "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" ...
 $ Coordenadas._x         : num  674904 674063 671872 676129 674807 ...
 $ Coordenadas._y         : num  4612931 4612970 4612102 4613402 4613068 ...
 $ Anio_emision           : int  2013 2013 2014 2013 2013 2013 2014 2014 2014 2013 ...
 $ Dias_hasta_expiracion  : int  3652 3652 3652 3652 3652 3652 3652 3653 3653 3652 ...

Cargamos la variable

provincia<- datos$Provincia

Ahora creamos la tabla de frecuencias:

Tabla de frecuencias

tabla_provincia <- table(provincia)
TDF_provincia<- as.data.frame(tabla_provincia)

ni_provincia<-TDF_provincia$Freq
n<-sum(ni_provincia)
hi_provincia<-ni_provincia/n *100

sum(hi_provincia)
[1] 100
TDFfinal_provincia<-data.frame(TDF_provincia,round(hi_provincia,2))
colnames(TDFfinal_provincia)<- c("Provincia","ni","hi (%)")

library(knitr)
Warning: package 'knitr' was built under R version 4.4.2
kable(TDFfinal_provincia, format = "markdown", caption = "Tabla de Frecuencias")
Tabla de Frecuencias
Provincia ni hi (%)
HUESCA 18004 10.75
TERUEL 11086 6.62
ZARAGOZA 138389 82.63

Imagen 1. Mapa de las provincias en la Comunidad Autónoma de Aragón.

A continuación, las gráficas para variables cualitativas nominales.

Gráficas

Creamos el diagrama de barras con la frecuencia absoluta para visualizar el conteo de ocurrencias de los valores de la variable.

################ Local
barplot(TDFfinal_provincia$ni, yaxt= "n", main = "Gráfica N°3.1.1.- Número edificios por provincia en
        la Comunidad Autónoma de Aragón",
        ylab="Cantidad",xlab = "Provincia",cex.names =0.8, names.arg = TDFfinal_provincia$Provincia,
        col = "brown")
#ajustamos el eje y de notación científica a números enteros
eje_y3<-pretty(TDFfinal_provincia$ni)
axis(2, at=eje_y3, labels=format(eje_y3, scientific=FALSE))

################# Global
barplot(TDFfinal_provincia$ni, yaxt= "n", main = "Gráfica N°3.1.2.- Cantidad de edificios por provincia en
        la Comunidad Autónoma de Aragón (Global)",
        ylab="Cantidad",xlab = "Provincia",cex.names =0.8, names.arg = TDFfinal_provincia$Provincia,
        col = "brown", ylim = c(0,167479))
#ajustamos el eje y de notación científica a números enteros
eje_y3.1<-pretty(c(0,167479))
axis(2, at=eje_y3.1, labels=format(eje_y3.1, scientific=FALSE))

Ahora, creamos el diagrama de barras con la frecuencia relativa para visualizar el porcentaje de ocurrencias de los valores.

barplot(TDFfinal_provincia$`hi (%)`,main = "Gráfica N°3.1.3.- Porcentaje de edificios por provincia en
        la Comunidad Autónoma de Aragón", ylab="Porcentaje (%)", 
        xlab = "Provincia",cex.names =0.8, names.arg = TDFfinal_provincia$Provincia,
        col = "purple3")

barplot(TDFfinal_provincia$`hi (%)`,main = "Gráfica N°3.1.4.- Porcentaje de edificios por provincia en
        la Comunidad Autónoma de Aragón (Global)", ylab="Porcentaje (%)", 
        xlab = "Provincia",cex.names =0.8, names.arg = TDFfinal_provincia$Provincia,
        col = "purple3", ylim = c(0,100))

El sector circular nos permite tener una mejor visualización del porcentaje de incidencia de un echo o fenómeno, usando la frecuencia relativa.

etiqueta3<-paste(TDFfinal_provincia$`hi (%)`,"%")
color3<-c(topo.colors(3))
pie(hi_provincia, radius = 1,labels = etiqueta3,
    col=color3, main= "Gráfica N°3.1.5.- Porcentaje de edificios por provincia en
        la Comunidad Autónoma de Aragón")
legend("bottomright",legend=TDFfinal_provincia$Provincia, fill=color3, title = "Leyenda",
       cex = 0.6, title.cex = 1)

median(provincia)
[1] "ZARAGOZA"

Conclusiones

La variable municipio de los edificios en de la Comunidad Autónoma de Aragón, es de tipo nominal donde el valor quemás se repite es “Zaragosa” con un 82.63% de ocurrencia y el valor central es el “Zaragosa”.