Cargar el archivo de datos

datos <- read.csv(“datos_negocios_8.csv”, sep = “;”, header = TRUE) “)

Resumen estadístico para variables numéricas

summary(datos)

Frecuencia de variables categóricas

{r}table(datos$Ciudad) library(ggplot2)

Histograma para la variable ‘Ingresos’

{r}ggplot(datos, aes(x = Ingresos)) + geom_histogram(binwidth = 5000, fill = "steelblue", color = "black") + labs(title = "Distribución de Ingresos", x = "Ingresos", y = "Frecuencia")

Gráfico de barras para la variable ‘Ciudad’

{r}ggplot(datos, aes(x = Ciudad)) + geom_bar(fill = "darkorange") + labs(title = "Frecuencia de Ciudades", x = "Ciudad", y = "Frecuencia")

Boxplot para la variable ‘Ingresos’

{r}ggplot(datos, aes(y = Ingresos)) + geom_boxplot(fill = "lightgreen") + labs(title = "Boxplot de Ingresos", y = "Ingresos")

Media e intervalo de confianza

{r}media <- mean(datos$Ingresos) error_est <- sd(datos$Ingresos) / sqrt(nrow(datos)) ic_media <- c(media - 1.96 * error_est, media + 1.96 * error_est) ic_media

Proporción e intervalo de confianza

{r}prop_satisfechos <- mean(datos$Satisfecho == 1) n <- nrow(datos) error_prop <- sqrt((prop_satisfechos * (1 - prop_satisfechos)) / n) ic_prop <- c(prop_satisfechos - 1.96 * error_prop, prop_satisfechos + 1.96 * error_prop) ic_prop

Intervalo de confianza para la varianza

{r}varianza <- var(datos$Ingresos) n <- nrow(datos) ic_varianza <- c((n-1)*varianza/qchisq(0.975, n-1), (n-1)*varianza/qchisq(0.025, n-1)) ic_varianza

Filtramos los datos por ciudad

{r}grupo1 <- datos %>% filter(Ciudad == "Ciudad A") grupo2 <- datos %>% filter(Ciudad == "Ciudad B")

Prueba t para diferencia de medias

{r}t.test(grupo1$Ingresos, grupo2$Ingresos)

Tablas de frecuencias

{r}tabla_satisfechos <- table(datos$Ciudad, datos$Satisfecho) # Prueba para diferencia de proporciones {r}prop.test(x = c(tabla_satisfechos["Ciudad A", "1"], tabla_satisfechos["Ciudad B", "1"]), n = c(sum(tabla_satisfechos["Ciudad A", ]), sum(tabla_satisfechos["Ciudad B", ])))

Tablas de frecuencias

```{r}tabla_satisfechos <- table(datos\(Ciudad, datos\)Satisfecho)

# Prueba para diferencia de proporciones
```{r}prop.test(x = c(tabla_satisfechos["Ciudad A", "1"], tabla_satisfechos["Ciudad B", "1"]),
n = c(sum(tabla_satisfechos["Ciudad A", ]), sum(tabla_satisfechos["Ciudad B", ])))