Cargar el archivo de datos

datos <- read.csv(“datos_negocios_8.csv”, sep = “,”, header = TRUE)

Resumen estadístico para variables numéricas

summary(datos)

Frecuencia de variables categóricas

table(datos$Ciudad) library(ggplot2)

Histograma para la variable ‘Ingresos’

ggplot(datos, aes(x = Ingresos)) + geom_histogram(binwidth = 5000, fill = “steelblue”, color = “black”) + labs(title = “Distribución de Ingresos”, x = “Ingresos”, y = “Frecuencia”)

Gráfico de barras para la variable ‘Ciudad’

ggplot(datos, aes(x = Ciudad)) + geom_bar(fill = “darkorange”) + labs(title = “Frecuencia de Ciudades”, x = “Ciudad”, y = “Frecuencia”)

Boxplot para la variable ‘Ingresos’

ggplot(datos, aes(y = Ingresos)) + geom_boxplot(fill = “lightgreen”) + labs(title = “Boxplot de Ingresos”, y = “Ingresos”)

Media e intervalo de confianza

media <- mean(datos$Ingresos) error_est <- sd(datos$Ingresos) / sqrt(nrow(datos)) ic_media <- c(media - 1.96 * error_est, media + 1.96 * error_est) ic_media

Proporción e intervalo de confianza

prop_satisfechos <- mean(datos$Satisfecho == 1) n <- nrow(datos) error_prop <- sqrt((prop_satisfechos * (1 - prop_satisfechos)) / n) ic_prop <- c(prop_satisfechos - 1.96 * error_prop, prop_satisfechos + 1.96 * error_prop) ic_prop

Intervalo de confianza para la varianza

varianza <- var(datos$Ingresos) n <- nrow(datos) ic_varianza <- c((n-1)varianza/qchisq(0.975, n-1), (n-1)varianza/qchisq(0.025, n-1)) ic_varianza

Filtramos los datos por ciudad

grupo1 <- datos %>% filter(Ciudad == “Ciudad A”) grupo2 <- datos %>% filter(Ciudad == “Ciudad B”)

Prueba t para diferencia de medias

t.test(grupo1$Ingresos, grupo2$Ingresos)

Tablas de frecuencias

tabla_satisfechos <- table(datos$Ciudad, datos$Satisfecho)

Prueba para diferencia de proporciones

prop.test(x = c(tabla_satisfechos[“Ciudad A”, “1”], tabla_satisfechos[“Ciudad B”, “1”]), n = c(sum(tabla_satisfechos[“Ciudad A”, ]), sum(tabla_satisfechos[“Ciudad B”, ])))

Tablas de frecuencias

tabla_satisfechos <- table(datos$Ciudad, datos$Satisfecho)

Prueba para diferencia de proporciones

prop.test(x = c(tabla_satisfechos[“Ciudad A”, “1”], tabla_satisfechos[“Ciudad B”, “1”]), n = c(sum(tabla_satisfechos[“Ciudad A”, ]), sum(tabla_satisfechos[“Ciudad B”, ])))

TALLER SEGUNDO CORTE ESTADISTICA 2

MAURO PEÑA - MARIA LUCIA RUDAS

2025-03-27

Cargar el archivo de datos

Resumen estadístico para variables numéricas

Frecuencia de variables categóricas

Histograma para la variable ‘Ingresos’

Gráfico de barras para la variable ‘Ciudad’

Boxplot para la variable ‘Ingresos’

Media e intervalo de confianza

Proporción e intervalo de confianza

Intervalo de confianza para la varianza

Filtramos los datos por ciudad

Prueba t para diferencia de medias

Tablas de frecuencias

Prueba para diferencia de proporciones

Tablas de frecuencias

Prueba para diferencia de proporciones