##### UNIVERSIDAD CENTRAL DEL ECUADOR #####
#### AUTOR: MARTIN SARMIENTO ####
### CARRERA: INGENIERÍA EN PETRÓLEOS #####
#### VARIABLE TAMAÑO ####
## DATASET ##
setwd("~/R/SIZE")
# Cargar dataset
Datos <- read.csv("DataSet_prov.csv", sep = ";")
# Estructura de los datos
str(Datos)## 'data.frame': 5075 obs. of 30 variables:
## $ FID_ : int 0 2 3 4 5 6 10 11 12 13 ...
## $ OBJECTID : int 127 129 130 131 132 133 137 138 139 140 ...
## $ code : chr "00127-ARG-P" "00129-ARG-G" "00130-ARG-P" "00131-ARG-P" ...
## $ plant_name : chr "Aconcagua solar farm" "Altiplano 200 Solar Power Plant" "Altiplano 200 Solar Power Plant" "Anchoris solar farm" ...
## $ country : chr "Argentina" "Argentina" "Argentina" "Argentina" ...
## $ operational_status : chr "announced" "operating" "operating" "construction" ...
## $ longitude : chr "-68,8713" "-66,895798" "-66,926102" "-68,915001" ...
## $ latitude : chr "-32,998501" "-24,1392" "-24,073999" "-33,330101" ...
## $ elevation : int 929 4000 4000 937 865 858 570 1612 665 3989 ...
## $ area : chr "250,337006" "4397290" "5774,399902" "645,163025" ...
## $ size : chr "Small" "Big" "Small" "Small" ...
## $ slope : chr "0,574179" "1,60257" "6,24265" "0,902748" ...
## $ slope_type : chr "Plano o casi plano" "Plano o casi plano" "Moderado" "Plano o casi plano" ...
## $ curvature : chr "0,000795" "-0,002781" "-0,043699" "0,002781" ...
## $ curvature_type : chr "Superficies planas o intermedias" "Superficies planas o intermedias" "Superficies c\xf3ncavas / Valles" "Superficies planas o intermedias" ...
## $ aspect : chr "55,124672" "188,707367" "270,913513" "108,434952" ...
## $ aspect_type : chr "Northeast" "South" "West" "East" ...
## $ dist_to_road : chr "127,2827045" "56014,95403" "52696,78572" "335,9280031" ...
## $ ambient_temperature : chr "12,6" "6,8" "6,8" "13,1" ...
## $ ghi : chr "6,11" "8,012" "7,878" "6,119" ...
## $ humidity : chr "53,74" "53,74" "53,74" "53,74" ...
## $ wind_speed : chr "3,7789" "7,02062" "8,32836" "3,87037" ...
## $ wind_direction : chr "55,099998" "55,099998" "55,099998" "55,099998" ...
## $ dt_wind : chr "Northeast" "Northeast" "Northeast" "Northeast" ...
## $ solar_aptitude : chr "0,746197" "0,8" "0,726996" "0,595309" ...
## $ solar_aptitude_rounded: int 7 8 7 6 7 7 7 8 7 8 ...
## $ solar_aptittude_class : chr "Alta" "Alta" "Alta" "Media" ...
## $ capacity : chr "25" "101" "107" "180" ...
## $ optimal_tilt : int 31 26 26 31 33 30 31 29 31 27 ...
## $ pv_potential : chr "4,983" "6,389" "6,392" "4,969" ...
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
#Extraer variable
Size <- Datos$size
# EDAvariable nominal
TDF_size <- table(Size)
tabla_size <- as.data.frame(TDF_size)
hi <- tabla_size$Freq/sum(tabla_size$Freq)
hi_porc <- hi*100
sum(hi_porc)## [1] 100
### Agrupación ####
tabla_SIZE$grupo <- case_when(
grepl("Small", tabla_SIZE$Tamaño, ignore.case = TRUE) ~ "Pequeña",
grepl("Medium", tabla_SIZE$Tamaño, ignore.case = TRUE) ~ "Mediana",
grepl("Big", tabla_SIZE$Tamaño, ignore.case = TRUE) ~ "Grande",
TRUE ~ "Otros / No Asignado"
)
tabla_resumen <- tabla_SIZE %>%
group_by(grupo) %>%
summarise(
Frecuencia = sum(Freq),
Porcentaje = sum(hi_porc))
# Definimos el orden lógico
orden_logico <- c("Pequeña",
"Mediana",
"Grande",
"Otros / No Asignado",
"TOTAL")
tabla_resumen$grupo <- factor(tabla_resumen$grupo, levels = orden_logico)
tabla_resumen <- tabla_resumen %>%
arrange(grupo)
# Renombramos columnas
colnames(tabla_resumen) <- c("Tamaño", "ni", "hi (%)")
# Tabla Intermedia GT
tabla_resumen_gt <- tabla_resumen %>%
gt() %>%
tab_header(
title = md("**Tabla N°1 de Agrupación por Tamaño de las Plantas Solares**")) %>%
tab_source_note(source_note = "Autor: Martin Sarmiento") %>%
cols_label(
Tamaño = "Categoría de Tamaño",
ni = "Frecuencia (ni)",
`hi (%)` = "Porcentaje (hi%)"
) %>%
fmt_number(columns = c(`hi (%)`), decimals = 2) %>%
tab_options(
heading.title.font.size = px(16),
column_labels.background.color = "#F0F0F0")
# Mostramos la tabla
tabla_resumen_gt| Tabla N°1 de Agrupación por Tamaño de las Plantas Solares | ||
| Categoría de Tamaño | Frecuencia (ni) | Porcentaje (hi%) |
|---|---|---|
| Pequeña | 3429 | 67.57 |
| Mediana | 1018 | 20.06 |
| Grande | 628 | 12.37 |
| Autor: Martin Sarmiento | ||
#### Crear de fila de totales ####
totales <- c("TOTAL", sum(tabla_resumen$ni), sum(tabla_resumen$`hi (%)`))
tabla_Size_Final <- rbind(tabla_resumen, totales)
# Convertir a números para GT
tabla_Size_Final$ni <- as.numeric(tabla_Size_Final$ni)
tabla_Size_Final$`hi (%)` <- as.numeric(tabla_Size_Final$`hi (%)`)
# TABLA 1
tabla_final_gt <- tabla_Size_Final %>%
gt() %>%
tab_header(
title = md("**Tabla N°2 de Distribución de Frecuencias del Tamaño de las Plantas Solares**")) %>%
tab_source_note(source_note = "Autor: Martin Sarmiento") %>%
cols_label(
Tamaño = "Categoría de Tamaño",
ni = "Frecuencia (ni)",
`hi (%)` = "Porcentaje (hi%)"
) %>%
cols_align(align = "center", columns = everything()) %>%
fmt_number(
columns = `hi (%)`,
decimals = 2
) %>%
tab_options(
heading.title.font.size = px(16),
heading.subtitle.font.size = px(14),
column_labels.background.color = "#F0F0F0")
tabla_final_gt| Tabla N°2 de Distribución de Frecuencias del Tamaño de las Plantas Solares | ||
| Categoría de Tamaño | Frecuencia (ni) | Porcentaje (hi%) |
|---|---|---|
| Pequeña | 3429 | 67.57 |
| Mediana | 1018 | 20.06 |
| Grande | 628 | 12.37 |
| TOTAL | 5075 | 100.00 |
| Autor: Martin Sarmiento | ||
par(mar = c(10, 4, 4, 2))
barplot(tabla_resumen$ni,
main="",
xlab = "",
ylab = "Cantidad",
col = "#E0EEEE",
names.arg=tabla_resumen$Tamaño,
cex.names = 0.8,
las = 2)
mtext("Tamaño", side = 1, line = 8)
mtext("Gráfica N°1: Distribución de Cantidad de Plantas Solares por Tamaño",
side = 3,
line = 2,
adj = 0.5,
cex = 0.9,
font = 2)par(mar = c(10, 4, 4, 2))
barplot(tabla_resumen$ni,
main="",
xlab = "",
ylab = "Cantidad",
col = "#E0EEEE",
ylim = c(0, sum(tabla_resumen$ni) * 1.1),
names.arg=tabla_resumen$Tamaño,
cex.names = 0.8,
las = 2)
mtext("Tamaño", side = 1, line = 8)
mtext("Gráfica N°2: Distribución de Cantidad Global de Plantas Solares por Tamaño",
side = 3,
line = 2,
adj = 0.5,
cex = 0.9,
font = 2)par(mar = c(10, 4, 4, 2))
barplot(tabla_resumen$`hi (%)`,
main="",
xlab = "",
ylab = "Porcentaje %",
col = "#E0EEEE",
names.arg=tabla_resumen$Tamaño,
cex.names = 0.7,
las = 2)
mtext("Tamaño", side = 1, line = 8)
mtext("Gráfica N°3: Distribución Porcentual de las Plantas Solares por Tamaño",
side = 3,
line = 2,
adj = 0.5,
cex = 0.9,
font = 2)par(mar = c(10, 4, 4, 2))
barplot(tabla_resumen$`hi (%)`,
main="",
xlab = "",
ylab = "Porcentaje %",
col = "#E0EEEE",
ylim = c(0,100),
names.arg=tabla_resumen$Tamaño,
cex.names = 0.7,
las = 2)
mtext("Tamaño", side = 1, line = 8)
mtext("Gráfica N°4: Distribución Porcentual de las Plantas Solares por Tamaño",
side = 3,
line = 2,
adj = 0.5,
cex = 0.9,
font = 2)par(mar = c(5, 6, 4, 10), xpd = TRUE)
labels_formato <- paste0(round(tabla_resumen$`hi (%)`, 2), "%")
colores_base <- c("#E0EEEE", "#C1CDCD", "#838B8B")
paleta_azure <- colorRampPalette(colores_base)
colores_finales <- paleta_azure(length(tabla_resumen$Tamaño))
pie(tabla_resumen$`hi (%)`,
main = "",
radius = 0.9,
labels = labels_formato,
col = colores_finales,
cex = 0.7)
mtext("Gráfica N°5: Distribución Porcentual de las Plantas Solares por Tamaño",
side = 3,
line = 2,
adj = 0.5,
cex = 0.9,
font = 2)
legend(x = 1.2, y = 1.1,
legend = tabla_resumen$Tamaño,
fill = colores_finales,
cex = 0.6,
title = "Tamaño",
bty = "n")# Cálculo de la Moda
moda_tamaño <- tabla_resumen$Tamaño[which.max(tabla_resumen$ni)]
# Tabla de Indicadores
tabla_indicadores <- data.frame(
"Variable" = "Tamaño",
"Rango" = "Pequeña, Mediana, Grande",
"Media (X)" = "-",
"Mediana (Me)" = "-",
"Moda (Mo)" = moda_tamaño,
"Varianza (V)" = "-",
"Desv. Est. (Sd)" = "-",
"C.V. (%)" = "-",
"Asimetría (As)" = "-",
"Curtosis (K)" = "-",
check.names = FALSE)
# Generar Tabla de Indicadores
tabla_conclusiones_gt <- tabla_indicadores %>%
gt() %>%
tab_header(title = md("**Tabla N°3 de Conclusiones de Tamaño de las Plantas Solares**")) %>%
tab_source_note(source_note = "Autor: Martin Sarmiento") %>%
tab_options(column_labels.background.color = "#F0F0F0")
tabla_conclusiones_gt| Tabla N°3 de Conclusiones de Tamaño de las Plantas Solares | |||||||||
| Variable | Rango | Media (X) | Mediana (Me) | Moda (Mo) | Varianza (V) | Desv. Est. (Sd) | C.V. (%) | Asimetría (As) | Curtosis (K) |
|---|---|---|---|---|---|---|---|---|---|
| Tamaño | Pequeña, Mediana, Grande | - | - | Pequeña | - | - | - | - | - |
| Autor: Martin Sarmiento | |||||||||
La variable “Tamaño”, presenta como valor más frecuente es Pequeña, con una participación destacada en la muestra.