#Variable continua discreta inicio de producción
# CARGAR LOS DATOS
datos <- read.csv("C:/Users/nicol/Downloads/brasil depurada 12.csv",
                  header = TRUE, dec = ".", sep = ";")

# --- VARIABLE: INICIO ---
inicio <- na.omit(datos$INICIO)

# --- EXTRAER AÑOS COMO NÚMEROS ---
fechas_convertidas <- as.Date(inicio, tryFormats = c("%d/%m/%Y"))
años <- as.numeric(format(fechas_convertidas, "%Y"))

# --- AGRUPAR EN DÉCADAS ---
decadas <- floor(años / 10) * 10

# Obtener frecuencias
frecuencia <- table(decadas)
frecuencia_relativa <- prop.table(frecuencia) * 100
frecuencia_acum <- cumsum(frecuencia)
frecuencia_relativa_acum <- cumsum(frecuencia_relativa)

# Crear tabla resumen
tabla_frecuencias_decadas <- data.frame(
  Decada = as.numeric(names(frecuencia)),
  Frecuencia = as.vector(frecuencia),
  Frecuencia_Relativa = round(as.vector(frecuencia_relativa), 2),
  Frecuencia_Acum = as.vector(frecuencia_acum),
  Frecuencia_Relativa_Acum = round(frecuencia_relativa_acum, 2)
)

# Mostrar tabla
print("Tabla de Frecuencias por Décadas:")
## [1] "Tabla de Frecuencias por Décadas:"
print(tabla_frecuencias_decadas)
##      Decada Frecuencia Frecuencia_Relativa Frecuencia_Acum
## 1920   1920          2                0.01               2
## 1930   1930          7                0.02               9
## 1940   1940        192                0.65             201
## 1950   1950        840                2.84            1041
## 1960   1960       2414                8.16            3455
## 1970   1970       2562                8.66            6017
## 1980   1980       9501               32.13           15518
## 1990   1990       3670               12.41           19188
## 2000   2000       5690               19.24           24878
## 2010   2010       4697               15.88           29575
##      Frecuencia_Relativa_Acum
## 1920                     0.01
## 1930                     0.03
## 1940                     0.68
## 1950                     3.52
## 1960                    11.68
## 1970                    20.34
## 1980                    52.47
## 1990                    64.88
## 2000                    84.12
## 2010                   100.00
# GRÁFICA DE BARRAS
barplot(frecuencia,
        main = "Gráfica No 02: Frecuencia de Producción por Década",
        col = "steelblue",
        xlab = "Década",
        ylab = "Cantidad de Proyectos")

# GRAFICA OJIVA ASCENDENTE
plot(as.numeric(names(frecuencia_acum)), frecuencia_acum,
     type = "b", pch = 19, col = "darkgreen",
     main = "Gráfica No 02.2: Ojiva de Producción por Década",
     xlab = "Década",
     ylab = "Frecuencia Acumulada")

# GRÁFICA OJIVA DESCENDENTE
frecuencia_acum_desc <- rev(cumsum(rev(frecuencia)))
plot(as.numeric(names(frecuencia_acum_desc)), frecuencia_acum_desc,
     type = "b", pch = 19, col = "firebrick",
     main = "Gráfica No 02.3: Ojiva Descendente de Producción por Década",
     xlab = "Década",
     ylab = "Frecuencia Acumulada Descendente")

#Ohiva ascendente y descendente (Para estimación de mediana, y linea guía de exactitud de medición mediana)
# Calcular mediana
mediana <- median(años)

# Dibujar las dos ojivas
plot(as.numeric(names(frecuencia_acum)), frecuencia_acum,
     type = "b", pch = 19, col = "darkgreen",
     main = "Gráfica No 02.4: Ojivas Ascendente y Descendente de Producción",
     xlab = "Década",
     ylab = "Frecuencia Acumulada",
     ylim = c(0, max(frecuencia_acum)),
     xlim = range(as.numeric(names(frecuencia))))

# Añadir ojiva descendente
lines(as.numeric(names(frecuencia_acum_desc)), frecuencia_acum_desc,
      type = "b", pch = 19, col = "firebrick")

# Línea vertical para la mediana
abline(v = mediana, col = "blue", lty = 2, lwd = 2)
text(mediana, max(frecuencia_acum) * 0.95, labels = paste("Mediana:", mediana),
     col = "blue", pos = 4)

#Boxplot
boxplot(años, horizontal = TRUE, col = "orange",
        main = "Distribución de Años de Inicio de Producción",
        xlab = "Año")

# Conclusion

conclusion <- "Del análisis de un total de 29575 registros correspondientes a los años de inicio de proyectos, se identificó una mayor concentración de actividades entre las décadas de 1970 y 1990, lo que sugiere un auge en la ejecución de proyectos durante ese periodo.
La distribución por décadas revela una disminución progresiva en la cantidad de proyectos iniciados después de la década de 1990, lo que podría indicar una desaceleración en la implementación de nuevos desarrollos. Este comportamiento temporal permite visualizar patrones históricos y evaluar cambios en las políticas o prioridades de inversión a lo largo del tiempo."