CONSUMO DE ENERGIA EN LA SEDE CENTRAL DE LA UNIVERSIDAD SURCOLOMBIANA DE NEIVA HUILA

Introducción

El presente trabajo se realizó con el fin de aplicar todos los conceptos y técnicas adquiridos y aprendidos en el curso de inferencial de la especialización de estadística de la universidad surcolombiana y su propósito es determinar el comportamiento de consumo de energía en la sede principal de la universidad surcolombiana.

Para el desarrollo de las habilidades prácticas en la manipulación y análisis de datos se empleó como herramienta el programa Rstudio, donde se aplicaron todas formulas necesaria para hacer un análisis inferencial de los datos de consumo de energía, a través del planteamiento de hipótesis sobre el comportamiento y su respectivo análisis. Los cuales, según su revisión, después de aplicar los intervalos de confianza, los estimadores como la media, la desviación estándar y las pruebas de hipótesis, sabemos que no guardan una distribución normal, por ende, se aplicó una prueba no paramétrica, como la prueba de Wilkoxon, Lo que permite establecer el rechazo de la hipótesis nula, al evidenciar diferencias significativas en el consumo de energía de la Universidad Surcolombiana durante los periodos analizados en este estudio.

Finalmente, los resultados nos indican que los periodos donde hay mayor consumo son los correspondiente al mes 10, 15 y 20, y la reducción más alta que se presenta en los datos analizados es en los meses del 30 al 40 que es el periodo de pandemia, donde se presenta un consumo bajo de energía en la sede principal de la universidad surcolombiana de la ciudad de Neiva.

Descripcion de los datos:Problema

En los últimos años el uso de energia a venido creciendo considerablemente, especialmente en las entidades o intituciones que agrupan un numero mayor de población. Así mismo, el auge de aparatos electronicos tanto en la población académica como en las actividades propias de administración de la universidad han llevado a un crecimiento de la demanda energetica, adicional el crecimiento en infraestructuras físicas inciden en la mayor demanda e incluso variaciones térmicas.

Es algo que se ve reflejado en las universidades en lo relacionado al consumo de energia, sin embargo, es dificil encontrar un estudio estadisto que permita hacer un analisis descriptivo del comportamiento en el consumo y en la Universidad Surcolombiana, simplemente se lleva un registro de consumos mes a mes pero no se hace una revisión de la evolución del consumo en el tiempo.

En este sentido, es indespensable hacer planteamientos o estudios que respondan a los altos consumos de energia, especificamente en instuciones de educación superior como la universidad surcolombiana en donde se debe analizar que posibles situaciones podrían estar incidiendo en un cosumo desmedido.

Metodología

Para el presente analisis se considero la variable cuantitativa consumo de energia (Kwh/mes) para 5 años (2018-2022). Para ello se utilizo una fuente de datos suministrada por la Universidad Surcolombiana y se recurre a la aplicación de análisis a través de la estadística inferencial, a fin de comprobar la hipótesis si existe o no diferencias significativas en el consumo de energía eléctrica durante 60 meses en la Sede Central de la Institución.

Población

El tipo de muestreo que se escogio para el ejercicio fue el muestreo por conveniencia teniendo en cuenta que se cuenta con una base de datos suministrada por la universidad.

Tipos de Hipotesis

Hipotesis Nula

H_0: No hay diferencia significativa del consumo de energía mensual de los años 2018 al 2022 en la sede central de la universidad surcolombiana.

Hipotesis Alternativa

H_1: Existencia diferencia significativa en el consumo de energía en los meses de los años 2018 al 2022 en la sede central de la universidad surcolombiana.

Resultados

Datos suministrados

Para el analisis Se tomaron 60 datos del consumo de energia electrica (Kwh/mes) correspondientes a los meses desde enero de 2018 hasta diciembre de 2022 de la sede central de la Universidad Surcolombiana.

consumo <- c(76301, 159019, 161081, 164839, 179862, 113650, 94282, 186463, 192588, 172391, 118018, 75882, 108778, 176059, 138830, 157766, 192944, 137842, 159193, 125774, 193963, 179044, 142735, 116948, 105758, 142727, 125302, 37220, 37523, 37165, 40690, 39992, 42463, 46209, 47002, 46820, 40172, 47632, 46884, 52498, 48754, 43960, 49687, 69430, 87680, 86994, 90040, 78549, 73212, 99483, 100482, 113566, 145862, 108954, 120167, 95764, 144850, 132249, 139556, 100281)

mes <- c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60)

Consumo de energia por mes

La presente grafica refleja el comportamiento del comsumo de energia por los 60 meses de los años 2018 a 2022.

# Estimaciones Media y Desviación Estandar

media_consumo<- mean(consumo)
media_consumo
## [1] 106497.1
desviacion_consumo <- sd(consumo)
desviacion_consumo
## [1] 49277.06

Estimaciones de la muestra

Con el fin de estimar el sesgo y la consistencia, se selecciono una muestra por conveniencia de 10 datos

consumo_conv <- c(76301, 159019, 161081, 164839, 179862, 113650, 94282, 186463, 192588, 172391)
media_consumo_conv<- mean(consumo_conv)
media_consumo_conv
## [1] 150047.6
desviacion_consumo_conv <- sd(consumo_conv)
desviacion_consumo_conv
## [1] 40576.47

Definimos si existe sesgo

Comprobamos si existe sesgo en el estimador

if (media_consumo != media_consumo_conv) {
  print("Si hay sesgo en el estimador de Media de consumo")
} else {
  print("El estimador de media de consumo es insesgado")
}
## [1] "Si hay sesgo en el estimador de Media de consumo"

Definimos si existe consistencia

Compromabos si exite consistencia, para ello tomo otra muestras por conveniencia de 30 datos.

consumo_conv_1 <- c(76301, 159019, 161081, 164839, 179862, 113650, 94282, 186463, 192588, 172391, 118018, 75882, 108778, 176059, 138830, 157766, 192944, 137842, 159193, 125774,193963, 179044, 142735, 116948, 105758, 142727, 125302, 37220, 37523, 37165)

Length1<-length(consumo_conv)
Length2<-length(consumo_conv_1)
Length3<-length(consumo)

media_consumo_conv_1<- mean(consumo_conv_1)
media_consumo_conv_1
## [1] 133664.9
cat("El promedio de consumo con:",Length1,"es igual a:" ,media_consumo_conv)
## El promedio de consumo con: 10 es igual a: 150047.6
cat("El promedio de consumo con:",Length2,"es igual a:" ,media_consumo_conv_1)
## El promedio de consumo con: 30 es igual a: 133664.9
cat("El promedio de consumo con:",Length3,"es igual a:" ,media_consumo)
## El promedio de consumo con: 60 es igual a: 106497.1

Se concluye que los datos no son consistentes, ya que al analizar la media con respecto a la media de una muestra de n=10 y otra muestra de n=30, hay variaciones importantes entre los resultados obtenidos. Esto se debe en primera medida, al tamaño de la población de estudio, la cual sólo cuenta con un total de 60 datos, adicional, se observa que los datos del consumo varían significativamente unos de otros, segundo, las muestras fueron seleccionadas por conveniencia.

Definimos si existe eficiencia

varianza_total <- var(consumo)
varianza_total
## [1] 2428228789
varianza_estimador1 <- var(consumo_conv)
varianza_estimador1
## [1] 1646449872
varianza_estimador2 <- var(consumo_conv_1)
varianza_estimador2
## [1] 2179312053
if (varianza_estimador1 < varianza_estimador2) {
  print("Es eficiente")
} else {
  print("No es eficiente")
}
## [1] "Es eficiente"

Intervalo de confianza

Intervalo de Confianza para la media del consumo de energia en el periodo del 2018 al 2022, se tienen 60 datos y se desea construir un intervalo de confianza del 90% para el consumo medio.

#Nivel de confianza
nivel_confianza <- 0.90

# Cálculos
media_muestra <- mean(consumo)
error_estandar <- sd(consumo) / sqrt(length(consumo))
valor_critico <- qt((1 + nivel_confianza) / 2, df = length(consumo) - 1)
margen_error <- valor_critico * error_estandar

# Intervalo de confianza
intervalo_confianza <- c(media_muestra - margen_error, media_muestra + margen_error)

# Mostrar resultado
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la media del consumo:", intervalo_confianza, "\n")
## Intervalo de confianza del 90 % para la media del consumo: 95866.26 117128

Planteamiento de la hipotesis nula y la alternativa

H_0: No hay diferencia significativa del consumo de energía mensual (Kwh/mes) en elperiodo comprendido entre el año 2018 al 2022 en la Sede Central de la Universidad Surcolombiana.

H_1: Existe diferencia significativa en el consumo de energía (Kwh/mes) mensual en el periodo comprendido entre el año 2018 al 2022 en la Sede Central de la Universidad Surcolombiana.

Teniendo en cuenta la H_0 y la H_a se realiza la verificación de la normalidad de los datos visualmente con Q-Q plot y la prueba Shapiro Wilk

shapiro.test(consumo)
## 
##  Shapiro-Wilk normality test
## 
## data:  consumo
## W = 0.93591, p-value = 0.00357
shapiro.test(mes)
## 
##  Shapiro-Wilk normality test
## 
## data:  mes
## W = 0.95523, p-value = 0.02761

De acuerdo a lo observado en la gráfica Q_Q plot en donde se evidencia que los puntos se encuentran distantes de la linea, es decir, existe cierta dipersion y según la prueba Shapiro Wilk el p-value corresponde a un valor de 0.00357. Por lo tanto, los datos no se distribuyen normalmente, en este sentido, se tiene un p-value > al 0.05, que nos indica que se debe rechazar la hipotesis nula y no rechazar la hipotesis alternativa. Para ello, realizamos una prueba de hipótesis no paramétrica: Aplicamos la prueba de Wilkoxon porque a través de ella se permite comparar las medianas de la muestra, y así mismo, determinar si existen diferencias entre los datos analizados.

Ahora se determina si hay diferencias significativas entre los datos de consumo de energia mensual (Kwh/mes) de la Sede Central de la Universidad Surcolombiana durante los meses correspondientes a los años 2018 al 2022.

# Realizar la prueba de Wilcoxon (Mann-Whitney U)
resultado_wilcoxon <- wilcox.test(consumo)
print(resultado_wilcoxon)
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  consumo
## V = 1830, p-value = 1.671e-11
## alternative hypothesis: true location is not equal to 0

Análisis de correlación entre las variables

En nuestro caso las variables de análisis son: La variable independiente (x) corresponde al mes o periodo de consumo La variable dependiente (y) corresponde al consumo (Kwh/mes) Por consiguiente utilizamos el suguiente código para determinar la correlación entre ellas y el tipo de correlación existente.

# Correlación
conc <- cor(mes,consumo)
conc
## [1] -0.4071213

Resultado de correlación

A partir del resultado de -0.4071213 de la correlación entre las variables de análisis (mes/consumo), se puede afirmar que es una correlación negativa con tendencia débil, por cuanto el valor se aleja del valor que la hace fuerte negativa (-1), se sugiere agregar una variable nueva u otr a diferente al mes con el fin de mejorar la correlación.

Grafica de datos por variable

# Comportamiento de datos por variable
pairs(mes~consumo)

Interpretación gráfico por variable

De acuerdo alos gráficos de cada variable se observa una alta dispersión de datos tanto en la variable independiente mes, como en la variable dependiente consumo, siendo un indicativo de poca normalidad de los datos.

Inferencia de los datos:

# Análisis de resultados
if (resultado_wilcoxon$p.value < 0.05) {
  cat("Hay diferencias significativas en el consumo de energia.")
} else {
  cat("No hay suficiente evidencia para afirmar diferencias significativas.")
}
## Hay diferencias significativas en el consumo de energia.

A partir del análisis de los datos, se puede inferir que las diferencias significativas en el consumo de energía mensual en los años de estudio, se constituyen debido por factores como la asistencia de estudiantes al campus universitario, la cual no es continua en algunos meses en los diferentes años, especialmente en los meses de mitad de año (junio, julio) y de cierre e inicio de año (diciembre y enero) los cuales son periodos de vacaciones, adicionalmente en años como el 2019 hubo situaciones no controladas por la entidad como paro estudiantil prolongado por mas de dos meses y entre marzo de 2020 hasta septiembre de 2021 fue periodo de pandemia declarado por el gobierno nacional que inciden en cambios significativos de reducción en la demanda de energía, como se constata en los picos de la grafica.

Conclusiones

Establecidas las hipótesis, se puedo comprobar que definitivamente la hipótesis nula se rechaza dado que el p-value está por debajo del 0.05 por tanto, no se rechaza la hipótesis alterna. Para obtener los resultados se aplico a los datos analizados, el grafico Q-Q Plot que nos indica el grado de dispersión y si están normalizados, posteriormente se utilizó la prueba de Shapiro que nos indicó el p-value, para después aplicar pruebas no paramétricas.

Una vez realizado el estudio sobre el consumo de energía (Kwh/mes) en la universidad surcolombiana de los meses correspondientes a los años 2018 al 2022, definidos para el análisis, como periodos del mes 1 al 60, partiendo de enero (periodo 1) de 2018 y finalizando en el mes de diciembre de 2022 (periodo 60), se pudo establecer que el comportamiento del consumo es no normalizado, debido a algunos factores identificados como la estacionalidad académica (periodos de vacaciones, paros estudiantiles) y la situación atípica de pandemia COVID-19, los que implicaron una reduccion en el consumo y por tanto generando las variaciones significativas en la demanda, la cual en periodos de operatividad al aumentar la afluencia de estudiantes el consumo se incrementa.

El estudio realizado es muy importante porque nos permite determinar ciertos tipos de comportamientos que en ciertos meses (junio-julio y diciembre-enero) del año se hacen repetitivos y en ellos las diferencias en el consumo energético no es extrema. Así mismo se mantienen consumo relativamente similares en los periodos de operación de la Universidad, sin embargo, este análisis permite que la entidad comprenda este comportamiento y pueda tomar decisiones más acertadas a futuro para establecer políticas de consumo que incidan en mayor reducción en los periodos de actividad académica y determine posibles excesos en los consumos a través de auditorías y revisión periodica de sus instalaciones eléctricas o cambios de sistemas de la tecnología para el uso en los diferentes espacios del campus en su sede central en la ciudad de Neiva.

Con respecto a la correlación de las variables analizadas, se evidencia que no hay correlación fuerte entre ellas por lo tanto, se puede establecer que el consumo de energía en la Universidad Surcolombiana, no tiene una dependencia signicativa del periodo (mes) en que éste se realice, dado que existen otros factores que pueden tener mayor incidencia, implicando un análisis más amplio para determinar las otras posibles variables que tengan mayor correlación con la variable dependente.

Bibliografia

Navidi, W. (2006). Estadística para Ingenieros y Científicos (García Hernández, Ana Elizabeth, Trad.). Mexico: McGraw-Hil.

Llinás Solano, H. (2020). Estadística inferencial. Colombia: Ediciones de la U.

ANDERSON, D. SWEENEY D. y Williams, T. (1982, 2005). Estadística para administración y economía. México: Thomson editores.