este analisis consta de 100 observaciones de ciudades, en donde muestran el ingreso por ciudad
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
datos <- read.csv("datos_negocios_8.csv")
head(datos)
## Ciudad Ingresos Satisfecho
## 1 Ciudad B 159.63 1
## 2 Ciudad B 100.79 1
## 3 Ciudad A 107.22 0
## 4 Ciudad B 154.00 0
## 5 Ciudad B 155.07 1
## 6 Ciudad A 153.81 1
el resumen estadistico muestra que el promedio de los ingresos de ciudades es de 71.62 mil dolares
summary(datos)
## Ciudad Ingresos Satisfecho
## Length:100 Min. : 71.62 Min. :0.00
## Class :character 1st Qu.: 88.83 1st Qu.:0.00
## Mode :character Median :110.92 Median :1.00
## Mean :114.24 Mean :0.54
## 3rd Qu.:139.97 3rd Qu.:1.00
## Max. :159.63 Max. :1.00
library(ggplot2)
ggplot(datos, aes(x = Ciudad, y = Ingresos, fill = Ciudad)) +
geom_boxplot() +
labs(title = "Distribución de Ingresos por Ciudad",
x = "Ciudad",
y = "Ingresos") +
theme_minimal()
El diagrama de cajas muestra que Ciudad B tiene una mediana de ingresos más alta que Ciudad A, lo que indica que en general sus habitantes ganan más. Además, la dispersión de los ingresos en Ciudad B es mayor, es decir, existe más variabilidad entre personas con ingresos altos y bajos. En Ciudad A, los ingresos son más estables y concentrados alrededor de valores medios.
ggplot(datos, aes(x = Ciudad, fill = as.factor(Satisfecho))) +
geom_bar(position = "dodge") +
labs(title = "Número de Clientes Satisfechos por Ciudad",
x = "Ciudad",
y = "Frecuencia",
fill = "Satisfecho") +
scale_fill_manual(values = c("lightblue", "coral"), labels = c("No", "Sí")) +
theme_minimal()
El gráfico de barras indica que en Ciudad A hay más clientes satisfechos (“Sí”) que no satisfechos (“No”), lo que refleja un mejor nivel de satisfacción general. En cambio, en Ciudad B ocurre lo contrario: predominan los clientes no satisfechos, por lo que la percepción del servicio o producto parece menos favorable.
ggplot(datos, aes(x = (Satisfecho), y = Ingresos, fill = as.factor(Satisfecho))) +
geom_boxplot() +
labs(title = "Distribución de Ingresos según Satisfacción del Cliente",
x = "Satisfacción del Cliente",
y = "Ingresos") +
scale_x_discrete(labels = c("0" = "No Satisfecho", "1" = "Satisfecho")) +
scale_fill_manual(values = c("lightblue", "coral")) +
theme_minimal()
El boxplot muestra que los clientes satisfechos (1) presentan una mediana de ingresos ligeramente mayor que los no satisfechos (0). Esto sugiere una posible relación positiva entre mayores ingresos y satisfacción. Sin embargo, la variabilidad es similar en ambos grupos, por lo que la diferencia no es demasiado marcada.
ggplot(datos, aes(x = Ingresos)) +
geom_histogram(binwidth = 5, fill = "skyblue", color = "black", alpha = 0.7) +
geom_density(aes(y = ..density.. * 5), color = "blue", size = 1) +
labs(title = "Distribución de los Ingresos",
x = "Ingresos",
y = "Frecuencia") +
theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once per session.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once per session.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
El histograma muestra que los ingresos están entre 70 y 160 aproximadamente. La mayoría de los datos se concentra entre 80 y 150, por lo que predominan ingresos medios.