#Variable continua discreta término de producción
# --- CARGAR DATOS ---
datos <- read.csv("C:/Users/nicol/Downloads/brasil depurada 12.csv",
                  header = TRUE, dec = ".", sep = ";")

# --- VARIABLE: TERMINO ---
termino <- na.omit(datos$TERMINO)

# Convertir a fecha y extraer años
fechas_termino <- as.Date(termino, tryFormats = c("%d/%m/%Y", "%Y-%m-%d"))
anios_termino <- as.numeric(format(fechas_termino, "%Y"))

# Agrupar por décadas
decadas_termino <- floor(anios_termino / 10) * 10

# Calcular frecuencias
frecuencia <- table(decadas_termino)
frecuencia_relativa <- prop.table(frecuencia) * 100
frecuencia_acum <- cumsum(frecuencia)
frecuencia_acum_desc <- rev(cumsum(rev(frecuencia)))
frecuencia_relativa_acum <- cumsum(frecuencia_relativa)

# Crear tabla resumen
tabla_frecuencias_termino <- data.frame(
  Decada = as.numeric(names(frecuencia)),
  Frecuencia = as.vector(frecuencia),
  Frecuencia_Relativa = round(as.vector(frecuencia_relativa), 2),
  Frecuencia_Acum = as.vector(frecuencia_acum),
  Frecuencia_Acum_Desc = as.vector(frecuencia_acum_desc),
  Frecuencia_Relativa_Acum = round(frecuencia_relativa_acum, 2)
)

# Mostrar tabla
print("Tabla de Frecuencias por Década (TERMINO):")
## [1] "Tabla de Frecuencias por Década (TERMINO):"
print(tabla_frecuencias_termino)
##      Decada Frecuencia Frecuencia_Relativa Frecuencia_Acum Frecuencia_Acum_Desc
## 1920   1920          2                0.01               2                27729
## 1930   1930          4                0.01               6                27727
## 1940   1940        188                0.68             194                27723
## 1950   1950        818                2.95            1012                27535
## 1960   1960       2427                8.75            3439                26717
## 1970   1970       2523                9.10            5962                24290
## 1980   1980       9538               34.40           15500                21767
## 1990   1990       3663               13.21           19163                12229
## 2000   2000       3941               14.21           23104                 8566
## 2010   2010       4625               16.68           27729                 4625
##      Frecuencia_Relativa_Acum
## 1920                     0.01
## 1930                     0.02
## 1940                     0.70
## 1950                     3.65
## 1960                    12.40
## 1970                    21.50
## 1980                    55.90
## 1990                    69.11
## 2000                    83.32
## 2010                   100.00
# Calcular mediana
mediana_termino <- median(anios_termino)

# --- GRÁFICO DE BARRAS ---
barplot(frecuencia,
        main = "Frecuencia de Término de producción por década",
        col = "steelblue",
        xlab = "Década",
        ylab = "Cantidad")

# --- OJIVA ASCENDENTE ---
plot(as.numeric(names(frecuencia_acum)), frecuencia_acum,
     type = "b", pch = 19, col = "darkgreen",
     main = "Ojiva Ascendente - Término de producción",
     xlab = "Década",
     ylab = "Frecuencia Acumulada")

# OJIVA DESCENDENTE
plot(as.numeric(names(frecuencia_acum_desc)), frecuencia_acum_desc,
     type = "b", pch = 19, col = "firebrick",
     main = "Ojiva Descendente - Término de producción",
     xlab = "Década",
     ylab = "Frecuencia Acumulada Descendente")

# OJIVAS COMBINADAS CON MEDIANA
plot(as.numeric(names(frecuencia_acum)), frecuencia_acum,
     type = "b", pch = 19, col = "darkgreen",
     main = "Ojivas Ascendente y Descendente - Término de producción",
     xlab = "Década",
     ylab = "Frecuencia Acumulada",
     ylim = c(0, max(frecuencia_acum)),
     xlim = range(as.numeric(names(frecuencia))))

lines(as.numeric(names(frecuencia_acum_desc)), frecuencia_acum_desc,
      type = "b", pch = 19, col = "firebrick")

abline(v = mediana_termino, col = "blue", lty = 2, lwd = 2)
text(mediana_termino, max(frecuencia_acum) * 0.95,
     labels = paste("Mediana:", mediana_termino),
     col = "blue", pos = 4)

#Boxplot
boxplot(anios_termino,
        horizontal = TRUE,
        col = "orchid",
        main = "Distribución de Fechas de Término de Producción",
        xlab = "Año de Término",
        border = "purple")

# CONCLUSIÓN

conclusion <- "Del análisis de un total de 27729 registros correspondientes al año de término de los proyectos se observó una mayor concentración de finalizaciones durante la década de 1980, lo cual indica una posible culminación masiva de actividades en ese periodo.
  Posteriormente, se percibe una reducción gradual en el número de proyectos concluidos, lo que podría reflejar una menor tasa de ejecución o un mayor tiempo de duración de los mismos.
  Este patrón temporal permite evaluar las dinámicas históricas de cierre de proyectos y sus posibles causas."