#Buscar directorio de trabajo
setwd("~/INGENIERÍA AMBIENTAL/Semestre 3/Estadística y Probabilidad/Proyecto Eficiencia Energética Aragón/1.Datos")
#Cargar el conjunto de datos
library(readr)
datos <- read.csv("Edificios_Reales.csv", sep = ";",dec = ".")Eficiencia energética de los edificios en aragón
Informe Estadístico
Provincia
Variable nominal
Estadística descriptiva
Buscamos el directorio de trabajo y cargamos la tabla de datos o el dataset:
Verificamos que rstudio nos lea correctamente los datos
str(datos)'data.frame': 167479 obs. of 17 variables:
$ Día_Emisión : int 29 26 26 12 27 17 13 8 7 16 ...
$ Mes_Emisión : int 6 9 2 6 6 6 2 4 4 12 ...
$ Año_Emisión : int 2013 2013 2014 2013 2013 2013 2014 2014 2014 2013 ...
$ Emision_CO2 : num 30.1 46.1 20.3 39.2 103.8 ...
$ Clasificacion_Emisiones: chr "E" "E" "D" "E" ...
$ Demanda_energética : num 142.3 174.4 94.2 187.7 409 ...
$ Clasificacion_consumo : chr "E" "E" "D" "E" ...
$ Tipo_edificio : chr "Vivienda individual" "Vivienda individual" "Vivienda individual" "Vivienda individual" ...
$ Estado_edificio : chr "Existente" "Existente" "Existente" "Existente" ...
$ Anio_construccion : int 1962 1974 1999 1970 1965 1968 1966 1963 2006 1970 ...
$ Superficie_m2 : num 49 81 72 65 46 ...
$ Municipio : chr "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" ...
$ Provincia : chr "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" "ZARAGOZA" ...
$ Coordenadas._x : num 674904 674063 671872 676129 674807 ...
$ Coordenadas._y : num 4612931 4612970 4612102 4613402 4613068 ...
$ Anio_emision : int 2013 2013 2014 2013 2013 2013 2014 2014 2014 2013 ...
$ Dias_hasta_expiracion : int 3652 3652 3652 3652 3652 3652 3652 3653 3653 3652 ...
Cargamos la variable
provincia<- datos$ProvinciaAhora creamos la tabla de frecuencias:
Tabla de frecuencias
tabla_provincia <- table(provincia)
TDF_provincia<- as.data.frame(tabla_provincia)
ni_provincia<-TDF_provincia$Freq
n<-sum(ni_provincia)
hi_provincia<-ni_provincia/n *100
sum(hi_provincia)[1] 100
TDFfinal_provincia<-data.frame(TDF_provincia,round(hi_provincia,2))
colnames(TDFfinal_provincia)<- c("Provincia","ni","hi (%)")
library(knitr)Warning: package 'knitr' was built under R version 4.4.2
kable(TDFfinal_provincia, format = "markdown", caption = "Tabla de Frecuencias")| Provincia | ni | hi (%) |
|---|---|---|
| HUESCA | 18004 | 10.75 |
| TERUEL | 11086 | 6.62 |
| ZARAGOZA | 138389 | 82.63 |
Imagen 1. Mapa de las provincias en la Comunidad Autónoma de Aragón.
A continuación, las gráficas para variables cualitativas nominales.
Gráficas
Creamos el diagrama de barras con la frecuencia absoluta para visualizar el conteo de ocurrencias de los valores de la variable.
################ Local
barplot(TDFfinal_provincia$ni, yaxt= "n", main = "Gráfica N°3.1.1.- Número edificios por provincia en
la Comunidad Autónoma de Aragón",
ylab="Cantidad",xlab = "Provincia",cex.names =0.8, names.arg = TDFfinal_provincia$Provincia,
col = "brown")
#ajustamos el eje y de notación científica a números enteros
eje_y3<-pretty(TDFfinal_provincia$ni)
axis(2, at=eje_y3, labels=format(eje_y3, scientific=FALSE))################# Global
barplot(TDFfinal_provincia$ni, yaxt= "n", main = "Gráfica N°3.1.2.- Cantidad de edificios por provincia en
la Comunidad Autónoma de Aragón (Global)",
ylab="Cantidad",xlab = "Provincia",cex.names =0.8, names.arg = TDFfinal_provincia$Provincia,
col = "brown", ylim = c(0,167479))
#ajustamos el eje y de notación científica a números enteros
eje_y3.1<-pretty(c(0,167479))
axis(2, at=eje_y3.1, labels=format(eje_y3.1, scientific=FALSE))Ahora, creamos el diagrama de barras con la frecuencia relativa para visualizar el porcentaje de ocurrencias de los valores.
barplot(TDFfinal_provincia$`hi (%)`,main = "Gráfica N°3.1.3.- Porcentaje de edificios por provincia en
la Comunidad Autónoma de Aragón", ylab="Porcentaje (%)",
xlab = "Provincia",cex.names =0.8, names.arg = TDFfinal_provincia$Provincia,
col = "purple3")barplot(TDFfinal_provincia$`hi (%)`,main = "Gráfica N°3.1.4.- Porcentaje de edificios por provincia en
la Comunidad Autónoma de Aragón (Global)", ylab="Porcentaje (%)",
xlab = "Provincia",cex.names =0.8, names.arg = TDFfinal_provincia$Provincia,
col = "purple3", ylim = c(0,100))El sector circular nos permite tener una mejor visualización del porcentaje de incidencia de un echo o fenómeno, usando la frecuencia relativa.
etiqueta3<-paste(TDFfinal_provincia$`hi (%)`,"%")
color3<-c(topo.colors(3))
pie(hi_provincia, radius = 1,labels = etiqueta3,
col=color3, main= "Gráfica N°3.1.5.- Porcentaje de edificios por provincia en
la Comunidad Autónoma de Aragón")
legend("bottomright",legend=TDFfinal_provincia$Provincia, fill=color3, title = "Leyenda",
cex = 0.6, title.cex = 1)median(provincia)[1] "ZARAGOZA"
Conclusiones
La variable municipio de los edificios en de la Comunidad Autónoma de Aragón, es de tipo nominal donde el valor quemás se repite es “Zaragosa” con un 82.63% de ocurrencia y el valor central es el “Zaragosa”.