setwd("~/INGENIERÍA AMBIENTAL/Semestre 3/Estadística y Probabilidad/Proyecto Eficiencia Energética Aragón")
library(readr)
datos <- read.csv("2.Doc´s/1. Variables Cualitativas/depuración variable clasificación de consumo.csv", sep = ";", dec = ".")Eficiencia energética de los edificios en Aragón
Informe estadístico
Clasificación de consumo energético
Variable cualitativa ordinal
Es la división del uso de energía por los edificios según su origen, sector de aplicación o tipo de fuente energética
Estadística descriptiva
Buscamos el directorio de trabajo y cargamos la tabla de datos o el dataset:
Verificamos que rstudio nos lea correctamente los datos
str(datos)'data.frame': 167292 obs. of 1 variable:
$ Clasificacion_consumo: chr "E" "E" "D" "E" ...
Cargamos la variable
tipo_consumo<-datos$Clasificacion_consumoVerificamos el nuevo tamaño muestral
n<-length(tipo_consumo)
n[1] 167292
Ahora realizamos la tabla de frecuencias para conocer el comportamiento de la variable por medio de valores numéricos:
Tabla de frecuencias
tabla_tipo_consumo <- table(tipo_consumo)
TDF_tipo_consumo<- as.data.frame(tabla_tipo_consumo)
ni_tipo_consumo<-TDF_tipo_consumo$Freq
n<-sum(ni_tipo_consumo)
n[1] 167292
hi_tipo_consumo<-ni_tipo_consumo/n *100
hi_tipo_consumo[1] 0.871530 1.258877 4.136480 10.997537 55.394759 11.137412 16.203405
sum(hi_tipo_consumo)[1] 100
TDFfinal_tipo_consumo<-data.frame(TDF_tipo_consumo,round(hi_tipo_consumo,2))
colnames(TDFfinal_tipo_consumo)<- c("Clasificación de Consumo Energético","ni","hi (%)")
library(knitr)Warning: package 'knitr' was built under R version 4.4.2
kable(TDFfinal_tipo_consumo, format = "markdown", caption = "Tabla 1. Frecuencias de los valores de la variable")| Clasificación de Consumo Energético | ni | hi (%) |
|---|---|---|
| A | 1458 | 0.87 |
| B | 2106 | 1.26 |
| C | 6920 | 4.14 |
| D | 18398 | 11.00 |
| E | 92671 | 55.39 |
| F | 18632 | 11.14 |
| G | 27107 | 16.20 |
Imagen 1.- Representación de las etiquetas de consumo energético. Obtenido de https://migrantesregulares.org/wp-content/uploads/eficiencia-energetica-del-refrigerador-768x518.jpg
Gráficas
Creamos el diagrama de barras con la frecuencia absoluta para visualizar el conteo de ocurrencias de los valores de la variable.
barplot(TDFfinal_tipo_consumo$ni, yaxt= "n", main = "Gráfica N°5.1.1.- Número de edificios según la clasificación de consumo energético en
la Comunidad Autónoma de Aragón",
ylab="Cantidad",xlab = "Clasificación de Consumo Energético",cex.names =0.8, names.arg = TDFfinal_tipo_consumo$`Clasificación de Consumo Energético`,
col = "red3",cex.main = 0.8)
#ajustamos el eje y de notación científica a números enteros
eje_y6<-pretty(TDFfinal_tipo_consumo$ni)
axis(2, at=eje_y6, labels=format(eje_y6, scientific=FALSE))barplot(TDFfinal_tipo_consumo$ni, yaxt= "n", main = "Gráfica N°5.1.2.- Número de edificios según la clasificación de consumo energético en
la Comunidad Autónoma de Aragón (Global)",
ylab="Cantidad",xlab = "Clasificación de Consumo Energético",cex.names =0.8, names.arg = TDFfinal_tipo_consumo$`Clasificación de Consumo Energético`,
col = "red3", ylim = c(0,n),cex.main = 0.8)
#ajustamos el eje y de notación científica a números enteros
eje_y6.1<-pretty(c(0,n))
axis(2, at=eje_y6.1, labels=format(eje_y6.1, scientific=FALSE))Ahora, creamos el diagrama de barras con la frecuencia relativa para visualizar el porcentaje de ocurrencias de los valores.
barplot(TDFfinal_tipo_consumo$`hi (%)`,main = "Gráfica N°5.1.3.- Porcentaje de edificios según la clasificación de consumo energético en
la Comunidad Autónoma de Aragón", ylab="Porcentaje (%)",
xlab = "Clasificación de Consumo Energético",cex.names =0.8, names.arg = TDFfinal_tipo_consumo$`Clasificación de Consumo Energético`,
col = "skyblue",cex.main = 0.8)barplot(TDFfinal_tipo_consumo$`hi (%)`,main = "Gráfica N°5.1.4.- Porcentaje de edificios según la clasificación de consumo energético en
la Comunidad Autónoma de Aragón (Global)", ylab="Porcentaje (%)",
xlab = "Clasificación de Consumo Energético",cex.names =0.8, names.arg = TDFfinal_tipo_consumo$`Clasificación de Consumo Energético`,
col = "skyblue", ylim = c(0,100),cex.main = 0.8)Ahora, creamos el diagra de sector circular porque nos permite una representación visual de las porciones relativas de los valores categóricos de la variable.
etiqueta<-paste(TDFfinal_tipo_consumo$`hi (%)`,"%")
color<-c(topo.colors(8))
pie(hi_tipo_consumo, radius = 1,labels = etiqueta,
col=color, main= "Gráfica N°5.1.2.- Porcentaje de edificios según la clasificación de consumo energético en
la Comunidad Autónoma de Aragón", cex=0.8,cex.main = 0.8)
legend("bottomright",legend=TDFfinal_tipo_consumo$`Clasificación de Consumo Energético`, fill=color, title = "Leyenda",
cex = 0.7, title.cex = 1)Indicadores
Los indicadores estadísticos son valores que resumen, describen y analizan características de un conjunto de datos. Estos indicadores permiten simplificar y entender grandes volúmenes de información de manera más eficiente. Se utilizan para tomar decisiones informadas.
mediana<-median(tipo_consumo)Warning in mean.default(sort(x, partial = half + 0L:1L)[half + 0L:1L]):
argument is not numeric or logical: returning NA
mediana[1] NA
moda<-c("E")
moda[1] "E"
Variable<-c("Clasificación de Consumo")
Tabla_indicadores<-data.frame(Variable,mediana,moda)
colnames(Tabla_indicadores)<-c("Variable","Mediana","Moda")
library(knitr)
kable(Tabla_indicadores, format = "markdown", caption = "Tabla 2. Indicadores estadíticos de la variable Clasificación de Consumo")| Variable | Mediana | Moda |
|---|---|---|
| Clasificación de Consumo | NA | E |
Conclusiones
La variable Clasificación de Consumo no presenta un valor central al ser el tamaño muestral par y ser de tipo cualitativa, y el valor que más se repite es la Clasificación de tipo E que indica un consumo medio entre 100% y 110% sobre la media siendo levemente perjudicial para el medio ambiente.