Cargar el archivo de datos

datos <- read.csv(“datos_negocios_8.csv”, sep = “;”, header = TRUE) “)

Resumen estadístico para variables numéricas

summary(datos)

Frecuencia de variables categóricas

{r}table(datos$Ciudad) library(ggplot2)

Histograma para la variable ‘Ingresos’

{r}ggplot(datos, aes(x = Ingresos)) + geom_histogram(binwidth = 5000, fill = "steelblue", color = "black") + labs(title = "Distribución de Ingresos", x = "Ingresos", y = "Frecuencia")

Gráfico de barras para la variable ‘Ciudad’

{r}ggplot(datos, aes(x = Ciudad)) + geom_bar(fill = "darkorange") + labs(title = "Frecuencia de Ciudades", x = "Ciudad", y = "Frecuencia")

Boxplot para la variable ‘Ingresos’

{r}ggplot(datos, aes(y = Ingresos)) + geom_boxplot(fill = "lightgreen") + labs(title = "Boxplot de Ingresos", y = "Ingresos")

Media e intervalo de confianza

{r}media <- mean(datos$Ingresos) error_est <- sd(datos$Ingresos) / sqrt(nrow(datos)) ic_media <- c(media - 1.96 * error_est, media + 1.96 * error_est) ic_media

Proporción e intervalo de confianza

{r}prop_satisfechos <- mean(datos$Satisfecho == 1) n <- nrow(datos) error_prop <- sqrt((prop_satisfechos * (1 - prop_satisfechos)) / n) ic_prop <- c(prop_satisfechos - 1.96 * error_prop, prop_satisfechos + 1.96 * error_prop) ic_prop

Intervalo de confianza para la varianza

{r}varianza <- var(datos$Ingresos) n <- nrow(datos) ic_varianza <- c((n-1)*varianza/qchisq(0.975, n-1), (n-1)*varianza/qchisq(0.025, n-1)) ic_varianza

Filtramos los datos por ciudad

{r}grupo1 <- datos %>% filter(Ciudad == "Ciudad A") grupo2 <- datos %>% filter(Ciudad == "Ciudad B")

Prueba t para diferencia de medias

{r}t.test(grupo1$Ingresos, grupo2$Ingresos)

Tablas de frecuencias

{r}tabla_satisfechos <- table(datos$Ciudad, datos$Satisfecho) # Prueba para diferencia de proporciones {r}prop.test(x = c(tabla_satisfechos["Ciudad A", "1"], tabla_satisfechos["Ciudad B", "1"]), n = c(sum(tabla_satisfechos["Ciudad A", ]), sum(tabla_satisfechos["Ciudad B", ])))

Tablas de frecuencias

```{r}tabla_satisfechos <- table(datos$Ciudad, datos$Satisfecho)

# Prueba para diferencia de proporciones
```{r}prop.test(x = c(tabla_satisfechos["Ciudad A", "1"], tabla_satisfechos["Ciudad B", "1"]),
n = c(sum(tabla_satisfechos["Ciudad A", ]), sum(tabla_satisfechos["Ciudad B", ])))

TALLER SEGUNDO CORTE ESTADISTICA 2

MAURO PEÑA - MARIA LUCIA RUDAS

2025-03-27

Cargar el archivo de datos

Resumen estadístico para variables numéricas

Frecuencia de variables categóricas

Histograma para la variable ‘Ingresos’

Gráfico de barras para la variable ‘Ciudad’

Boxplot para la variable ‘Ingresos’

Media e intervalo de confianza

Proporción e intervalo de confianza

Intervalo de confianza para la varianza

Filtramos los datos por ciudad

Prueba t para diferencia de medias

Tablas de frecuencias

Tablas de frecuencias