datos <- read.csv(“datos_negocios_8.csv”, sep = “;”, header = TRUE) “)
summary(datos)
{r}table(datos$Ciudad) library(ggplot2)
{r}ggplot(datos, aes(x = Ingresos)) + geom_histogram(binwidth = 5000, fill = "steelblue", color = "black") + labs(title = "Distribución de Ingresos", x = "Ingresos", y = "Frecuencia")
{r}ggplot(datos, aes(x = Ciudad)) + geom_bar(fill = "darkorange") + labs(title = "Frecuencia de Ciudades", x = "Ciudad", y = "Frecuencia")
{r}ggplot(datos, aes(y = Ingresos)) + geom_boxplot(fill = "lightgreen") + labs(title = "Boxplot de Ingresos", y = "Ingresos")
{r}media <- mean(datos$Ingresos) error_est <- sd(datos$Ingresos) / sqrt(nrow(datos)) ic_media <- c(media - 1.96 * error_est, media + 1.96 * error_est) ic_media
{r}prop_satisfechos <- mean(datos$Satisfecho == 1) n <- nrow(datos) error_prop <- sqrt((prop_satisfechos * (1 - prop_satisfechos)) / n) ic_prop <- c(prop_satisfechos - 1.96 * error_prop, prop_satisfechos + 1.96 * error_prop) ic_prop
{r}varianza <- var(datos$Ingresos) n <- nrow(datos) ic_varianza <- c((n-1)*varianza/qchisq(0.975, n-1), (n-1)*varianza/qchisq(0.025, n-1)) ic_varianza
{r}grupo1 <- datos %>% filter(Ciudad == "Ciudad A") grupo2 <- datos %>% filter(Ciudad == "Ciudad B")
{r}t.test(grupo1$Ingresos, grupo2$Ingresos)
{r}tabla_satisfechos <- table(datos$Ciudad, datos$Satisfecho)
# Prueba para diferencia de proporciones
{r}prop.test(x = c(tabla_satisfechos["Ciudad A", "1"], tabla_satisfechos["Ciudad B", "1"]), n = c(sum(tabla_satisfechos["Ciudad A", ]), sum(tabla_satisfechos["Ciudad B", ])))
```{r}tabla_satisfechos <- table(datos\(Ciudad, datos\)Satisfecho)
# Prueba para diferencia de proporciones
```{r}prop.test(x = c(tabla_satisfechos["Ciudad A", "1"], tabla_satisfechos["Ciudad B", "1"]),
n = c(sum(tabla_satisfechos["Ciudad A", ]), sum(tabla_satisfechos["Ciudad B", ])))