datos <- read.csv(“datos_negocios_8.csv”, sep = “,”, header = TRUE)
summary(datos)
table(datos$Ciudad) library(ggplot2)
ggplot(datos, aes(x = Ingresos)) + geom_histogram(binwidth = 5000, fill = “steelblue”, color = “black”) + labs(title = “Distribución de Ingresos”, x = “Ingresos”, y = “Frecuencia”)
ggplot(datos, aes(x = Ciudad)) + geom_bar(fill = “darkorange”) + labs(title = “Frecuencia de Ciudades”, x = “Ciudad”, y = “Frecuencia”)
ggplot(datos, aes(y = Ingresos)) + geom_boxplot(fill = “lightgreen”) + labs(title = “Boxplot de Ingresos”, y = “Ingresos”)
media <- mean(datos\(Ingresos) error_est <- sd(datos\)Ingresos) / sqrt(nrow(datos)) ic_media <- c(media - 1.96 * error_est, media + 1.96 * error_est) ic_media
prop_satisfechos <- mean(datos$Satisfecho == 1) n <- nrow(datos) error_prop <- sqrt((prop_satisfechos * (1 - prop_satisfechos)) / n) ic_prop <- c(prop_satisfechos - 1.96 * error_prop, prop_satisfechos + 1.96 * error_prop) ic_prop
varianza <- var(datos$Ingresos) n <- nrow(datos) ic_varianza <- c((n-1)varianza/qchisq(0.975, n-1), (n-1)varianza/qchisq(0.025, n-1)) ic_varianza
grupo1 <- datos %>% filter(Ciudad == “Ciudad A”) grupo2 <- datos %>% filter(Ciudad == “Ciudad B”)
t.test(grupo1\(Ingresos, grupo2\)Ingresos)
tabla_satisfechos <- table(datos\(Ciudad, datos\)Satisfecho)
prop.test(x = c(tabla_satisfechos[“Ciudad A”, “1”], tabla_satisfechos[“Ciudad B”, “1”]), n = c(sum(tabla_satisfechos[“Ciudad A”, ]), sum(tabla_satisfechos[“Ciudad B”, ])))
tabla_satisfechos <- table(datos\(Ciudad, datos\)Satisfecho)
prop.test(x = c(tabla_satisfechos[“Ciudad A”, “1”], tabla_satisfechos[“Ciudad B”, “1”]), n = c(sum(tabla_satisfechos[“Ciudad A”, ]), sum(tabla_satisfechos[“Ciudad B”, ])))