---
title: "Datos subsidio año 2018"
author: "Grupo 3"
date: "Junio de 2025"
output:
flexdashboard::flex_dashboard:
orientation: rows
social: menu
source_code: embed
---
Estadísticas
========================================================
Row
-------------------------------------
### Estadísticas del conjunto de Datos subsidio 2018
```{r setup, include=FALSE}
datos_subsidio_2018 <- read.csv("datos_subsidio_2018.csv", encoding = "UTF-8")
```
```{r}
head(datos_subsidio_2018)
summary(datos_subsidio_2018)
names(datos_subsidio_2018)
```
Correlación de Pearson
========================================================
Row
-------------------------------------
### Histograma de ingresos mensuales
```{r}
datos_subsidio_2018 <- read.csv("datos_subsidio_2018.csv", sep = ";", encoding = "UTF-8")
library(ggplot2)
ggplot(datos_subsidio_2018, aes(x = INGRESO_MENSUAL))+
geom_histogram(fill = "green", color = "lightgreen")+
labs(
title = "Histograma de Ingresos Mensuales",
x = "Ingreso Mensual",
y = "Frecuencia"
)+
theme_minimal()
```
### Histograma de Valor de Subsidio
```{r}
datos_subsidio_2018 <- read.csv("datos_subsidio_2018.csv", sep = ";", encoding = "UTF-8")
library(ggplot2)
ggplot(datos_subsidio_2018, aes(x = VALOR_SUBSIDIO))+
geom_histogram(fill = "steelblue", color = "lightblue")+
labs(
title = "Histograma Valor Subsidio",
x = "Valor de Subsidio",
y = "Frecuencia"
)+
theme_minimal()
```
Row
-------------------------------------
### Correlación de Pearson
```{r}
### Datos númericos
datos_subsidio_2018$INGRESO_MENSUAL <- as.numeric(datos_subsidio_2018$INGRESO_MENSUAL)
datos_subsidio_2018$VALOR_SUBSIDIO <- as.numeric(datos_subsidio_2018$VALOR_SUBSIDIO)
cor.test(datos_subsidio_2018$INGRESO_MENSUAL, datos_subsidio_2018$VALOR_SUBSIDIO, method = "pearson")
```
### Dispersión Ingreso Mensual Vs. Valor de Subsidio
```{r}
ggplot(datos_subsidio_2018, aes(x = INGRESO_MENSUAL, y = VALOR_SUBSIDIO))+
geom_point(alpha = 0.6, color = "brown")+
geom_smooth(method = "lm", se = TRUE, color = "red")+
labs(
title = "Dispersión Ingreso Mensual Vs. Valor de subsidio",
x = "Ingreso Mensual",
y = "Valor de Subsidio"
)
```
Boxplots
========================================================
### Diagrama de Cajas Comuna Vs. Número de personas por hogar
```{r}
### Datos categoricos y numericos
datos_subsidio_2018$COMUNA <- as.factor(datos_subsidio_2018$COMUNA)
datos_subsidio_2018$NUM_PERS_HOOGAR <- as.numeric(datos_subsidio_2018$NUM_PERS_HOGAR)
### Diagrama de Caja
ggplot(datos_subsidio_2018, aes(x = COMUNA, y = NUM_PERS_HOGAR))+
geom_boxplot(fill = "red", color = "darkred")+
labs(
title = " Diagrama de caja Comuna Vs. Número de personas por hogar",
x = "Comuna",
y = "Número de personas por hogar"
)+
theme_minimal()
```
Tabla cruzada y barras
========================================================
Row
-------------------------------------
### Diagrama de barras
```{r}
### Conversión a factores
datos_subsidio_2018$OCUPACION <- as.factor(datos_subsidio_2018$OCUPACION)
datos_subsidio_2018$CONDICION_ESPECIAL <- as.factor(datos_subsidio_2018$CONDICION_ESPECIAL)
### Diagrama de barras apiladas
ggplot(datos_subsidio_2018, aes(x = OCUPACION, fill = CONDICION_ESPECIAL)) +
geom_bar(position = "stack", color = "black") +
labs(
title = "Distribución de ocupación de acuerdo a la condición especial",
x = "Ocupación",
y = "Frecuencia",
fill = "Condición especial"
) +
theme_minimal()
```
### Tabla Cruzada de datos
```{r}
tabla_cruzada <- table(datos_subsidio_2018$OCUPACION, datos_subsidio_2018$CONDICION_ESPECIAL)
tabla_cruzada
```