#Buscar directorio de trabajo
setwd("~/INGENIERÍA AMBIENTAL/Semestre 3/Estadística y Probabilidad/Proyecto Eficiencia Energética Aragón/1.Datos")
#Cargar el conjunto de datos
library(readr)
datos <- read.csv("Edificios_Reales.csv", sep = ";",dec = ".")Eficiencia energética de los edificios en Aragón
Informe estadístico
Estado de edificio
Variable cualitativa ordinal
Característica que indica la etapa en la que se encuentra la edificación en el momento del registro de datos.
Estadística descriptiva
Buscamos el directorio de trabajo y cargamos la tabla de datos o el dataset:
Verificamos que rstudio nos lea correctamente los datos
str(datos)'data.frame': 167479 obs. of 17 variables:
$ Día_Emisión : int 29 26 26 12 27 17 13 8 7 16 ...
$ Mes_Emisión : int 6 9 2 6 6 6 2 4 4 12 ...
$ Año_Emisión : int 2013 2013 2014 2013 2013 2013 2014 2014 2014 2013 ...
$ Emision_CO2 : num 30.1 46.1 20.3 39.2 103.8 ...
$ Clasificacion_Emisiones: chr "E" "E" "D" "E" ...
$ Demanda_energética : num 142.3 174.4 94.2 187.7 409 ...
$ Clasificacion_consumo : chr "E" "E" "D" "E" ...
$ Tipo_edificio : chr "Vivienda individual" "Vivienda individual" "Vivienda individual" "Vivienda individual" ...
$ Estado_edificio : chr "Existente" "Existente" "Existente" "Existente" ...
$ Anio_construccion : int 1962 1974 1999 1970 1965 1968 1966 1963 2006 1970 ...
$ Superficie_m2 : num 49 81 72 65 46 ...
$ Municipio : chr "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" ...
$ Provincia : chr "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" ...
$ Coordenadas._x : num 674904 674063 671872 676129 674807 ...
$ Coordenadas._y : num 4612931 4612970 4612102 4613402 4613068 ...
$ Anio_emision : int 2013 2013 2014 2013 2013 2013 2014 2014 2014 2013 ...
$ Dias_hasta_expiracion : int 3652 3652 3652 3652 3652 3652 3652 3653 3653 3652 ...
Cargamos la variable
estado<- datos$Estado_edificioVerificamos el tamaño muestral
n<-length(estado)
n[1] 167479
Ahora realizamos la tabla de frecuencias para conocer el comportamiento de la variable por medio de valores numéricos:
Tabla de frecuencias
tabla_estado <- table(estado)
TDF_estado<- as.data.frame(tabla_estado)
ni_estado<-TDF_estado$Freq
n<-sum(ni_estado)
hi_estado<-ni_estado/n *100
sum(hi_estado)[1] 100
estado1<-c("Existente","Obra Terminada","Nueva Construcción","Reforma")
TDFfinal_estado<-data.frame(estado1,ni_estado,round(hi_estado,2))
colnames(TDFfinal_estado)<- c("Estado de Edificio","ni","hi (%)")
library(knitr)Warning: package 'knitr' was built under R version 4.4.2
kable(TDFfinal_estado, format = "markdown", caption = "Tabla 1. Frecuencias de las categorizaciones del estado de los edificios")| Estado de Edificio | ni | hi (%) |
|---|---|---|
| Existente | 165666 | 98.92 |
| Obra Terminada | 892 | 0.53 |
| Nueva Construcción | 798 | 0.48 |
| Reforma | 123 | 0.07 |
Gráficas
Creamos el diagrama de barras con la frecuencia absoluta para visualizar el conteo de ocurrencias de los valores de la variable.
barplot(TDFfinal_estado$ni, yaxt= "n", main = "Gráfica N°6.1.1.- Número de edificios, según su estado, en
la Comunidad Autónoma de Aragón",
ylab="Cantidad",xlab = "Estado de Edificio",cex.names =0.8, names.arg = TDFfinal_estado$`Estado de Edificio`,
col = "red3",cex.main = 0.8,cex.axis = 0.5)
#ajustamos el eje y de notación científica a números enteros
eje_y6<-pretty(TDFfinal_estado$ni)
axis(2, at=eje_y6, labels=format(eje_y6, scientific=FALSE))################# Global
barplot(TDFfinal_estado$ni, yaxt= "n", main = "Gráfica N°6.1..2.- Número de edificios, según su estado, en
la Comunidad Autónoma de Aragón (Global)",
ylab="Cantidad",xlab = "Estado de Edificio",cex.names =0.8, names.arg = TDFfinal_estado$`Estado de Edificio`,
col = "red3", ylim = c(0,n),cex.main = 0.8)
#ajustamos el eje y de notación científica a números enteros
eje_y6.1<-pretty(c(0,167479))
axis(2, at=eje_y6.1, labels=format(eje_y6.1, scientific=FALSE))Ahora, creamos el diagrama de barras con la frecuencia relativa para visualizar el porcentaje de ocurrencias de los valores.
barplot(TDFfinal_estado$`hi (%)`,main = "Gráfica N°6.1.3.- Porcentaje de edificios, según su estado, en
la Comunidad Autónoma de Aragón", ylab="Porcentaje (%)",
xlab = "Estado de Edificio",cex.names =0.8, names.arg = TDFfinal_estado$`Estado de Edificio`,
col = "skyblue",cex.main = 0.8,ylim = c(0,100))barplot(TDFfinal_estado$`hi (%)`,main = "Gráfica N°6.1.4.- Porcentaje de edificios, según su estado, en
la Comunidad Autónoma de Aragón (Global)", ylab="Porcentaje (%)",
xlab = "Estado de Edificio",cex.names =0.8, names.arg = TDFfinal_estado$`Estado de Edificio`,
col = "skyblue", ylim = c(0,100),cex.main = 0.8)Ahora, creamos el diagrama de sector circular porque nos permite una representación visual de las porciones relativas de los valores categóricos de la variable.
etiqueta6<-paste(TDFfinal_estado$`hi (%)`,"%")
color6<-c(topo.colors(4))
pie(hi_estado, radius = 1,labels = etiqueta6,
col=color6, main= "Gráfica N°6.1.5.- Porcentaje de edificios, según su estado, en
la Comunidad Autónoma de Aragón", cex=0.9,cex.main = 0.8)
legend("bottomright",legend=TDFfinal_estado$`Estado de Edificio`, fill=color6, title = "Leyenda",
cex = 0.7, title.cex = 1)Indicadores
Los indicadores estadísticos son valores que resumen, describen y analizan características de un conjunto de datos. Estos indicadores permiten simplificar y entender grandes volúmenes de información de manera más eficiente. Se utilizan para tomar decisiones informadas.
mediana<-median(estado)
mediana[1] "Existente"
moda<-c("Existente")
moda[1] "Existente"
Variable<-c("Estado de Edificio")
Tabla_indicadores<-data.frame(Variable,mediana,moda)
colnames(Tabla_indicadores)<-c("Variable","Mediana","Moda")
library(knitr)
kable(Tabla_indicadores, format = "markdown", caption = "Tabla 2. Indicadores estadíticos de la variable Estado de Edificio")| Variable | Mediana | Moda |
|---|---|---|
| Estado de Edificio | Existente | Existente |
Conclusiones
El estado de los edificios en la Comunidad Autónoma de Aragón giran en torno a la clasificación Existente y, de igual manera, es el valor que más se repite y representa que, el 1.8% se encuentra en modificaciones y tienen una emisión de CO2 por carbono embebido y residual, es decir, el carbono generado por la extración, transporte y el desecho de los materiales de construcción y el otro 98.92% que se encuentra en estado existente, emiste carbono operacional, es decir, por el uso del edificio.