#Variable continua discreta inicio de producción
# CARGAR LOS DATOS
datos <- read.csv("C:/Users/nicol/Downloads/brasil depurada 12.csv",
header = TRUE, dec = ".", sep = ";")
# --- VARIABLE: INICIO ---
inicio <- na.omit(datos$INICIO)
# --- EXTRAER AÑOS COMO NÚMEROS ---
fechas_convertidas <- as.Date(inicio, tryFormats = c("%d/%m/%Y"))
años <- as.numeric(format(fechas_convertidas, "%Y"))
# --- AGRUPAR EN DÉCADAS ---
decadas <- floor(años / 10) * 10
# Obtener frecuencias
frecuencia <- table(decadas)
frecuencia_relativa <- prop.table(frecuencia) * 100
frecuencia_acum <- cumsum(frecuencia)
frecuencia_relativa_acum <- cumsum(frecuencia_relativa)
# Crear tabla resumen
tabla_frecuencias_decadas <- data.frame(
Decada = as.numeric(names(frecuencia)),
Frecuencia = as.vector(frecuencia),
Frecuencia_Relativa = round(as.vector(frecuencia_relativa), 2),
Frecuencia_Acum = as.vector(frecuencia_acum),
Frecuencia_Relativa_Acum = round(frecuencia_relativa_acum, 2)
)
# Mostrar tabla
print("Tabla de Frecuencias por Décadas:")
## [1] "Tabla de Frecuencias por Décadas:"
print(tabla_frecuencias_decadas)
## Decada Frecuencia Frecuencia_Relativa Frecuencia_Acum
## 1920 1920 2 0.01 2
## 1930 1930 7 0.02 9
## 1940 1940 192 0.65 201
## 1950 1950 840 2.84 1041
## 1960 1960 2414 8.16 3455
## 1970 1970 2562 8.66 6017
## 1980 1980 9501 32.13 15518
## 1990 1990 3670 12.41 19188
## 2000 2000 5690 19.24 24878
## 2010 2010 4697 15.88 29575
## Frecuencia_Relativa_Acum
## 1920 0.01
## 1930 0.03
## 1940 0.68
## 1950 3.52
## 1960 11.68
## 1970 20.34
## 1980 52.47
## 1990 64.88
## 2000 84.12
## 2010 100.00
# GRÁFICA DE BARRAS
barplot(frecuencia,
main = "Gráfica No 02: Frecuencia de Producción por Década",
col = "steelblue",
xlab = "Década",
ylab = "Cantidad de Proyectos")

# GRAFICA OJIVA ASCENDENTE
plot(as.numeric(names(frecuencia_acum)), frecuencia_acum,
type = "b", pch = 19, col = "darkgreen",
main = "Gráfica No 02.2: Ojiva de Producción por Década",
xlab = "Década",
ylab = "Frecuencia Acumulada")

# GRÁFICA OJIVA DESCENDENTE
frecuencia_acum_desc <- rev(cumsum(rev(frecuencia)))
plot(as.numeric(names(frecuencia_acum_desc)), frecuencia_acum_desc,
type = "b", pch = 19, col = "firebrick",
main = "Gráfica No 02.3: Ojiva Descendente de Producción por Década",
xlab = "Década",
ylab = "Frecuencia Acumulada Descendente")

#Ohiva ascendente y descendente (Para estimación de mediana, y linea guía de exactitud de medición mediana)
# Calcular mediana
mediana <- median(años)
# Dibujar las dos ojivas
plot(as.numeric(names(frecuencia_acum)), frecuencia_acum,
type = "b", pch = 19, col = "darkgreen",
main = "Gráfica No 02.4: Ojivas Ascendente y Descendente de Producción",
xlab = "Década",
ylab = "Frecuencia Acumulada",
ylim = c(0, max(frecuencia_acum)),
xlim = range(as.numeric(names(frecuencia))))
# Añadir ojiva descendente
lines(as.numeric(names(frecuencia_acum_desc)), frecuencia_acum_desc,
type = "b", pch = 19, col = "firebrick")
# Línea vertical para la mediana
abline(v = mediana, col = "blue", lty = 2, lwd = 2)
text(mediana, max(frecuencia_acum) * 0.95, labels = paste("Mediana:", mediana),
col = "blue", pos = 4)

#Boxplot
boxplot(años, horizontal = TRUE, col = "orange",
main = "Distribución de Años de Inicio de Producción",
xlab = "Año")

# Conclusion
conclusion <- "Del análisis de un total de 29575 registros correspondientes a los años de inicio de proyectos, se identificó una mayor concentración de actividades entre las décadas de 1970 y 1990, lo que sugiere un auge en la ejecución de proyectos durante ese periodo.
La distribución por décadas revela una disminución progresiva en la cantidad de proyectos iniciados después de la década de 1990, lo que podría indicar una desaceleración en la implementación de nuevos desarrollos. Este comportamiento temporal permite visualizar patrones históricos y evaluar cambios en las políticas o prioridades de inversión a lo largo del tiempo."