#Buscar directorio de trabajo
setwd("~/INGENIERÍA AMBIENTAL/Semestre 3/Estadística y Probabilidad/Proyecto Eficiencia Energética Aragón/1.Datos")
#Cargar el conjunto de datos
library(readr)
datos <- read.csv("División zonales.csv", sep = ";",dec = ".")Eficiencia energética de los edificios en aragón
Informe Estadístico
Municipio
Variable nominal
Estadística descriptiva
Buscamos el directorio de trabajo y cargamos la tabla de datos o el dataset:
Verificamos que rstudio nos lea correctamente los datos
str(datos)'data.frame': 167442 obs. of 19 variables:
$ fid : int 8 9 10 35 66 127 137 143 191 205 ...
$ Día_Emisión : int 4 14 14 19 3 24 7 22 20 26 ...
$ Mes_Emisión : int 11 11 11 2 6 11 1 5 11 2 ...
$ Año_Emisión : int 2013 2013 2013 2014 2014 2014 2015 2014 2013 2015 ...
$ Emision_CO2 : chr "55,7" "49,99" "59,68" "61,89" ...
$ Clasificacion_Emisiones: chr "E" "E" "E" "E" ...
$ Demanda_energética : chr "275,06" "246,91" "294,64" "238,78" ...
$ Clasificacion_consumo : chr "E" "E" "E" "E" ...
$ Tipo_edificio : chr "Vivienda individual" "Vivienda individual" "Vivienda individual" "Vivienda individual" ...
$ Estado_edificio : chr "Existente" "Existente" "Existente" "Existente" ...
$ Anio_construccion : int 2000 2000 2000 1900 2002 1940 2008 1977 1900 1940 ...
$ Superficie_m2 : chr "50,9" "69,96" "69,96" "143,5" ...
$ Municipio : chr "LA PUEBLA DE HIJAR" "LA PUEBLA DE HIJAR" "LA PUEBLA DE HIJAR" "AZAILA" ...
$ Provincia : chr "TERUEL" "TERUEL" "TERUEL" "TERUEL" ...
$ Coordenadas._x : chr "714200,37" "714200,37" "714200,37" "709931,6" ...
$ Coordenadas._y : chr "4566060,65" "4566060,65" "4566060,65" "4574178,7" ...
$ Anio_emision : int 2013 2013 2013 2014 2014 2014 2015 2014 2013 2015 ...
$ Dias_hasta_expiracion : int 3652 3652 3652 3652 3653 3653 3653 3653 3652 3653 ...
$ Zona : chr "Centro" "Centro" "Centro" "Centro" ...
Cargamos la variable
municipios<- datos$ZonaDebido a la cantidad de valores, agrupamos los municipios en zonas de acuerdo a la imagen 1:
Imagen 1. Divisiones zonales en la Comunidad autónoma de Aragón para agrupamiento de municipios.
Ahora creamos la tabla de frecuencias:
Tabla de frecuencias
tabla_municipios <- table(municipios)
TDF_municipios<- as.data.frame(tabla_municipios)
ni_municipios<-TDF_municipios$Freq
n<-sum(ni_municipios)
hi_municipios<-ni_municipios/n *100
hi_municipios[1] 75.044493 2.480859 11.790351 6.028356 4.655941
sum(hi_municipios)[1] 100
TDFfinal_municipios<-data.frame(TDF_municipios,round(hi_municipios,2))
colnames(TDFfinal_municipios)<- c("Municipios","ni","hi (%)")
library(knitr)Warning: package 'knitr' was built under R version 4.4.2
kable(TDFfinal_municipios, format = "markdown", caption = "Tabla de Frecuencias")| Municipios | ni | hi (%) |
|---|---|---|
| Centro | 125656 | 75.04 |
| Este | 4154 | 2.48 |
| Norte | 19742 | 11.79 |
| Oeste | 10094 | 6.03 |
| Sur | 7796 | 4.66 |
A continuación, las gráficas para variables cualitativas nominales.
Gráficas
Creamos el diagrama de barras con la frecuencia absoluta para visualizar el conteo de ocurrencias de los valores de la variable.
barplot(TDFfinal_municipios$ni, yaxt= "n", main = "Gráfica N°2.1.1.- Número edificios por municipios en
la Comunidad Autónoma de Aragón",
ylab="Cantidad",xlab = "Municipios",cex.names =0.8, names.arg = TDFfinal_municipios$Municipios,
col = "brown", axis.lty = 1)
#ajustamos el eje y de notación científica a números enteros
eje_y2<-pretty(TDFfinal_municipios$ni)
axis(2, at=eje_y2, labels=format(eje_y2, scientific=FALSE))################# Global
barplot(TDFfinal_municipios$ni, yaxt= "n", main = "Gráfica N°2.1.2.- Cantidad de edificios por municipios en
la Comunidad Autónoma de Aragón (Global)",
ylab="Cantidad",xlab = "Municipios",cex.names =0.8, names.arg = TDFfinal_municipios$Municipios,
col = "brown", ylim = c(0,167479), axis.lty = 1)
#ajustamos el eje y de notación científica a números enteros
eje_y2.1<-pretty(c(0,167479))
axis(2, at=eje_y2.1, labels=format(eje_y2.1, scientific=FALSE))Ahora, creamos el diagrama de barras con la frecuencia relativa para visualizar el porcentaje de ocurrencias de los valores.
barplot(TDFfinal_municipios$`hi (%)`,main = "Gráfica N°2.1.3.- Porcentaje de edificios por municipios en
la Comunidad Autónoma de Aragón", ylab="Porcentaje (%)",
xlab = "Municipios",cex.names =0.8, names.arg = TDFfinal_municipios$Municipios,
col = "purple2", axis.lty = 1)barplot(TDFfinal_municipios$`hi (%)`,main = "Gráfica N°2.1.4.- Porcentaje de edificios por municipios en
la Comunidad Autónoma de Aragón (Global)", ylab="Porcentaje (%)",
xlab = "Municipios",cex.names =0.8, names.arg = TDFfinal_municipios$Municipios,
col = "purple2", ylim = c(0,100), axis.lty = 1)El sector circular nos permite tener una mejor visualización del porcentaje de incidencia de un echo o fenómeno, usando la frecuencia relativa.
etiqueta2<-paste(TDFfinal_municipios$`hi (%)`,"%")
color2<-c(topo.colors(5))
pie(hi_municipios, radius = 1,labels = etiqueta2,
col=color2, main= "Gráfica N°2.1.5.- Porcentaje de edificios por municipios en
la Comunidad Autónoma de Aragón")
legend("bottomright",legend=TDFfinal_municipios$Municipios, fill=color2, title = "Leyenda",
cex = 0.6, title.cex = 1)Conclusiones
La variable municipio de los edificios en de la Comunidad Autónoma de Aragón, es de tipo nominal, donde el valor que más se repite es “Zaragosa”, sin embargo, para simplificación del análisis, se agrupo los municipios en zonas, en donde, la zona centro es la de mayor ocurrencia con un 72.04%.