#Buscar directorio de trabajo
setwd("~/INGENIERÍA AMBIENTAL/Semestre 3/Estadística y Probabilidad/Proyecto Eficiencia Energética Aragón/1.Datos")
#Cargar el conjunto de datos
library(readr)
datos <- read.csv("Edificios_Reales.csv", sep = ";",dec = ".")Eficiencia energética de los edificios en Aragón
Informe estadístico
Clasificación de emisiones de CO2
Variable cualitativa ordinal
Se refiere a la categorización de los gases contaminantes liberados al ambiente según su origen, impacto y composición.
Estadística descriptiva
Buscamos el directorio de trabajo y cargamos la tabla de datos o el dataset:
Verificamos que rstudio nos lea correctamente los datos
str(datos)'data.frame': 167479 obs. of 17 variables:
$ Día_Emisión : int 29 26 26 12 27 17 13 8 7 16 ...
$ Mes_Emisión : int 6 9 2 6 6 6 2 4 4 12 ...
$ Año_Emisión : int 2013 2013 2014 2013 2013 2013 2014 2014 2014 2013 ...
$ Emision_CO2 : num 30.1 46.1 20.3 39.2 103.8 ...
$ Clasificacion_Emisiones: chr "E" "E" "D" "E" ...
$ Demanda_energética : num 142.3 174.4 94.2 187.7 409 ...
$ Clasificacion_consumo : chr "E" "E" "D" "E" ...
$ Tipo_edificio : chr "Vivienda individual" "Vivienda individual" "Vivienda individual" "Vivienda individual" ...
$ Estado_edificio : chr "Existente" "Existente" "Existente" "Existente" ...
$ Anio_construccion : int 1962 1974 1999 1970 1965 1968 1966 1963 2006 1970 ...
$ Superficie_m2 : num 49 81 72 65 46 ...
$ Municipio : chr "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" ...
$ Provincia : chr "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" ...
$ Coordenadas._x : num 674904 674063 671872 676129 674807 ...
$ Coordenadas._y : num 4612931 4612970 4612102 4613402 4613068 ...
$ Anio_emision : int 2013 2013 2014 2013 2013 2013 2014 2014 2014 2013 ...
$ Dias_hasta_expiracion : int 3652 3652 3652 3652 3652 3652 3652 3653 3653 3652 ...
Cargamos la variable
tipo_emision<- datos$Clasificacion_EmisionesVerificamos el tamaño muestral
n<-length(tipo_emision)
n[1] 167479
Ahora realizamos la tabla de frecuencias para conocer el comportamiento de la variable por medio de valores numéricos:
Tabla de frecuencias
tabla_tipo_emision <- table(tipo_emision)
TDF_tipo_emision<- as.data.frame(tabla_tipo_emision)
ni_tipo_emision<-TDF_tipo_emision$Freq
n<-sum(ni_tipo_emision)
hi_tipo_emision<-ni_tipo_emision/n *100
sum(hi_tipo_emision)[1] 100
TDFfinal_tipo_emision<-data.frame(TDF_tipo_emision,round(hi_tipo_emision,2))
colnames(TDFfinal_tipo_emision)<- c("Clasificación de Emisiones","ni","hi (%)")
library(knitr)Warning: package 'knitr' was built under R version 4.4.2
kable(TDFfinal_tipo_emision, format = "markdown", caption = "Tabla 1.Frecuencias de las categorías de la variable")| Clasificación de Emisiones | ni | hi (%) |
|---|---|---|
| A | 1814 | 1.08 |
| B | 2546 | 1.52 |
| C | 9408 | 5.62 |
| D | 22982 | 13.72 |
| E | 93885 | 56.06 |
| F | 19694 | 11.76 |
| G | 17150 | 10.24 |
Gráficas
Creamos el diagrama de barras con la frecuencia absoluta para visualizar el conteo de ocurrencias de los valores de la variable.
barplot(TDFfinal_tipo_emision$ni, main = "Gráfica N°4.1.1.- Número de edificios según su clasificación de emisiones en
la Comunidad Autónoma de Aragón",
ylab="Cantidad",xlab = "Clasificación de Emisiones",cex.names =0.8, names.arg = TDFfinal_tipo_emision$`Clasificación de Emisiones`,
col = "gray",cex.main = 0.8)################# Global
barplot(TDFfinal_tipo_emision$ni, main = "Gráfica N°4.1.2.- Número de edificios según su clasificación de emisiones en
la Comunidad Autónoma de Aragón (Global)",
ylab="Cantidad",xlab = "Clasificación de Emisiones",cex.names =0.8, names.arg = TDFfinal_tipo_emision$`Clasificación de Emisiones`,
col = "gray", ylim = c(0,n),cex.main = 0.8)Ahora, creamos el diagrama de barras con la frecuencia relativa para visualizar el porcentaje de ocurrencias de los valores.
barplot(TDFfinal_tipo_emision$`hi (%)`,main = "Gráfica N°4.1.3.- Porcentaje de edificios según su clasificación de emisiones en
la Comunidad Autónoma de Aragón", ylab="Porcentaje (%)",
xlab = "Clasificación de Emisiones",cex.names =0.8, names.arg = TDFfinal_tipo_emision$`Clasificación de Emisiones`,
col = "pink",cex.main = 0.8)barplot(TDFfinal_tipo_emision$`hi (%)`,main = "Gráfica N°4.1.4.- Porcentaje de edificios según su clasificación de emisiones en
la Comunidad Autónoma de Aragón (Global)", ylab="Porcentaje (%)",
xlab = "Clasificación de Emisiones",cex.names =0.8, names.arg = TDFfinal_tipo_emision$`Clasificación de Emisiones`,
col = "pink", ylim = c(0,100),cex.main = 0.8)Ahora, creamos el diagrama de sector circular porque nos permite una representación visual de las porciones relativas de los valores categóricos de la variable.
etiqueta5<-paste(TDFfinal_tipo_emision$`hi (%)`,"%")
color5<-c(topo.colors(7))
pie(hi_tipo_emision, radius = 1,labels = etiqueta5,
col=color5, main= "Gráfica N°4.1.5.- Porcentaje de edificios según su clasificación de emisiones en
la Comunidad Autónoma de Aragón", cex=0.8,cex.main = 0.8)
legend("bottomright",legend=TDFfinal_tipo_emision$`Clasificación de Emisiones`, fill=color5, title = "Leyenda",
cex = 0.7, title.cex = 1)Indicadores
Los indicadores estadísticos son valores que resumen, describen y analizan características de un conjunto de datos. Estos indicadores permiten simplificar y entender grandes volúmenes de información de manera más eficiente. Se utilizan para tomar decisiones informadas.
mediana<-median(tipo_emision)
mediana[1] "E"
moda<-c("E")
moda[1] "E"
Variable<-c("Clasificación de Emisiones")
Tabla_indicadores<-data.frame(Variable,mediana,moda)
colnames(Tabla_indicadores)<-c("Variable","Mediana","Moda")
library(knitr)
kable(Tabla_indicadores, format = "markdown", caption = "Tabla 2. Indicadores estadíticos de la variable Clasificación de Emisiones")| Variable | Mediana | Moda |
|---|---|---|
| Clasificación de Emisiones | E | E |
Conclusiones
La variable Clasificación de Emisiones presenta un valor central, la Categoria E, y el valor que más se repite es la Clasificación de tipo E que indica una emisión media entre 100% y 110% sobre la media siendo levemente perjudicial para el medio ambiente.