##### UNIVERSIDAD CENTRAL DEL ECUADOR #####
#### AUTOR: MARTIN SARMIENTO ####
### CARRERA: INGENIERÍA EN PETRÓLEOS #####
#### VARIABLE PAISES ####
## DATASET ##
setwd("~/R INFERENCIAL/COUNTRY")
# Cargar dataset
Datos <- read.csv("DataSet_prov.csv", sep = ";", fileEncoding = "latin1")
## Estructura de los datos
str(Datos)## 'data.frame': 5075 obs. of 30 variables:
## $ FID_ : int 0 2 3 4 5 6 10 11 12 13 ...
## $ OBJECTID : int 127 129 130 131 132 133 137 138 139 140 ...
## $ code : chr "00127-ARG-P" "00129-ARG-G" "00130-ARG-P" "00131-ARG-P" ...
## $ plant_name : chr "Aconcagua solar farm" "Altiplano 200 Solar Power Plant" "Altiplano 200 Solar Power Plant" "Anchoris solar farm" ...
## $ country : chr "Argentina" "Argentina" "Argentina" "Argentina" ...
## $ operational_status : chr "announced" "operating" "operating" "construction" ...
## $ longitude : chr "-68,8713" "-66,895798" "-66,926102" "-68,915001" ...
## $ latitude : chr "-32,998501" "-24,1392" "-24,073999" "-33,330101" ...
## $ elevation : int 929 4000 4000 937 865 858 570 1612 665 3989 ...
## $ area : chr "250,337006" "4397290" "5774,399902" "645,163025" ...
## $ size : chr "Small" "Big" "Small" "Small" ...
## $ slope : chr "0,574179" "1,60257" "6,24265" "0,902748" ...
## $ slope_type : chr "Plano o casi plano" "Plano o casi plano" "Moderado" "Plano o casi plano" ...
## $ curvature : chr "0,000795" "-0,002781" "-0,043699" "0,002781" ...
## $ curvature_type : chr "Superficies planas o intermedias" "Superficies planas o intermedias" "Superficies cóncavas / Valles" "Superficies planas o intermedias" ...
## $ aspect : chr "55,124672" "188,707367" "270,913513" "108,434952" ...
## $ aspect_type : chr "Northeast" "South" "West" "East" ...
## $ dist_to_road : chr "127,2827045" "56014,95403" "52696,78572" "335,9280031" ...
## $ ambient_temperature : chr "12,6" "6,8" "6,8" "13,1" ...
## $ ghi : chr "6,11" "8,012" "7,878" "6,119" ...
## $ humidity : chr "53,74" "53,74" "53,74" "53,74" ...
## $ wind_speed : chr "3,7789" "7,02062" "8,32836" "3,87037" ...
## $ wind_direction : chr "55,099998" "55,099998" "55,099998" "55,099998" ...
## $ dt_wind : chr "Northeast" "Northeast" "Northeast" "Northeast" ...
## $ solar_aptitude : chr "0,746197" "0,8" "0,726996" "0,595309" ...
## $ solar_aptitude_rounded: int 7 8 7 6 7 7 7 8 7 8 ...
## $ solar_aptittude_class : chr "Alta" "Alta" "Alta" "Media" ...
## $ capacity : chr "25" "101" "107" "180" ...
## $ optimal_tilt : int 31 26 26 31 33 30 31 29 31 27 ...
## $ pv_potential : chr "4,983" "6,389" "6,392" "4,969" ...
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# Tabla de frecuencias absolutas
Tabla <- as.data.frame(TDF_pais)
# Renombrar columna de frecuencia
colnames(Tabla) <- c("Pais", "ni")
# Asegurar tipo character
Tabla$Pais <- as.character(Tabla$Pais)
# Crear porcentaje
Tabla$`hi (%)` <- (Tabla$ni / sum(Tabla$ni)) * 100
# Fila total
fila_total_country <- tibble(
Pais = "TOTAL",
ni = sum(Tabla$ni),
`hi (%)` = sum(Tabla$`hi (%)`)
)
# Unir fila total
tabla_Final <- bind_rows(Tabla, fila_total_country)
# TABLA GT
tabla_country_gt <- tabla_Final %>%
gt() %>%
tab_header(
title = md("**Tabla N°1 de Distribución de Frecuencias de País de las Plantas Solares**")
) %>%
tab_source_note(
source_note = "Autor: Martin Sarmiento"
) %>%
cols_label(
Pais = "País",
ni = "Frecuencia (ni)",
`hi (%)` = "Porcentaje (hi%)"
) %>%
fmt_number(
columns = `hi (%)`,
decimals = 2
) %>%
tab_options(
heading.title.font.size = px(16),
column_labels.background.color = "#F0F0F0"
)
# Mostrar tabla
tabla_country_gt| Tabla N°1 de Distribución de Frecuencias de País de las Plantas Solares | ||
| País | Frecuencia (ni) | Porcentaje (hi%) |
|---|---|---|
| Argentina | 79 | 1.56 |
| Bolivia | 11 | 0.22 |
| Brazil | 4136 | 81.50 |
| Chile | 324 | 6.38 |
| Colombia | 378 | 7.45 |
| Ecuador | 46 | 0.91 |
| Guyana | 8 | 0.16 |
| Paraguay | 3 | 0.06 |
| Peru | 68 | 1.34 |
| Suriname | 3 | 0.06 |
| Uruguay | 18 | 0.35 |
| Venezuela | 1 | 0.02 |
| TOTAL | 5075 | 100.00 |
| Autor: Martin Sarmiento | ||
# Diagrama de barrras ni
par(mar = c(11, 4, 4, 2))
barplot(TDF_pais,
main = "Gráfica N°1: Distribución de Cantidad de Plantas Solares por País",
xlab = "",
ylab = "Cantidad",
col = "skyblue",
las = 3,
cex.names = 0.8,
cex.main = 0.9,
ylim = c(0, max(TDF_pais) * 1.2))
mtext("País", side = 1, line = 7)# Diagrama de barrras hi
porcentajes <- TDF_pais / sum(TDF_pais) * 100
par(mar = c(11, 4, 4, 2))
barplot(porcentajes,
main = "Gráfica N°2: Distribución Porcentual de las Plantas Solares por País",
xlab = "",
ylab = "Porcentaje %",
col = "skyblue",
las = 3,
cex.names = 0.8,
cex.main = 0.9,
ylim = c(0, max(porcentajes) * 1.2))
mtext("País", side = 1, line = 7)# Probabilidad
P_Pais <- Tabla$ni / sum(Tabla$ni)
P_Pais <- P_Pais[Tabla$Pais != "TOTAL"]
# Nombres de los países
nombres_Pais <- Tabla$Pais[Tabla$Pais != "TOTAL"]
par(mar = c(11, 4, 4, 2))
barplot(P_Pais,
main = "Gráfica N°3: Distribución de Probabilidad de las Plantas Solares por País",
xlab = "",
ylab = "Probabilidad",
col = "skyblue",
names.arg = nombres_Pais,
las = 3,
cex.names = 0.8,
cex.main = 0.9)
mtext("País", side = 1, line = 7)¿Cuál es la probabilidad de que exista una planta solar en el país seleccionado?
nombre_pais <- "Ecuador"
probabilidad_pais <- round(
(Tabla$ni[Tabla$Pais == nombre_pais] /
sum(Tabla$ni[Tabla$Pais != "TOTAL"])) * 100,
1
)
print(paste("La probabilidad es de:", probabilidad_pais, "%"))## [1] "La probabilidad es de: 0.9 %"