Análisis de Variables en el Conjunto de Datos de Telefonía

# Cargar el conjunto de datos de telefonía
telefonia <-read.csv("https://raw.githubusercontent.com/VictorGuevaraP/Estadistica-R/master/Caso_telefon%C3%ADa.csv",
                    encoding = "latin1", sep=";")

head(telefonia)

Variables Cualitativas Nominales

Gráfico de Barras para Género

Los gráficos de barras son ideales para representar la frecuencia de cada categoría en una variable cualitativa nominal.

El siguente gráfico permite visualizar la distribución de género en el conjunto de datos.

library(ggplot2)
ggplot(telefonia, aes(x = Género)) +
  geom_bar(fill = "skyblue", color = "black") +
  labs(title = "Distribución de Género en Telefonía", x = "Género", y = "Frecuencia")

Gráfico Circular para Opinión

Los gráficos circulares son una forma alternativa de representar la distribución proporcional de categorías.

Este gráfico ayuda a identificar la proporción de opiniones en relación con el total de respuestas.

library(ggplot2)
ggplot(telefonia, aes(x = "", fill = Opinión)) +
  geom_bar(width = 1, stat = "count") +
  coord_polar(theta = "y") +
  labs(title = "Distribución de Opinión en Telefonía")

Variables Cualitativas Ordinales

Gráfico de Barras para Sucursal

Los gráficos de barras son útiles para mostrar la frecuencia de cada categoría en una variable cualitativa ordinal.

Este gráfico permite visualizar la distribución de sucursales y su orden.

library(ggplot2)
ggplot(telefonia, aes(x = factor(Sucursal), fill = factor(Sucursal))) +
  geom_bar() +
  labs(title = "Distribución de Sucursal en Telefonía", x = "Sucursal", y = "Frecuencia")

Gráfico Circular para Reclamos

El gráfico circular resalta la proporción de reclamos en relación con el total de respuestas.

Este gráfico ofrece una perspectiva diferente en comparación con el gráfico de barras para variables ordinales.

library(ggplot2)
ggplot(telefonia, aes(x = "", fill = factor(Reclamos))) +
  geom_bar(width = 1, stat = "count") +
  coord_polar(theta = "y") +
  labs(title = "Distribución de Reclamos en Telefonía")

Variables Cuantitativas Discretas

Gráfico de Barras para Llamadas

En el contexto de variables cuantitativas discretas, un gráfico de barras ayuda a visualizar la distribución de las llamadas en categorías discretas.

Este gráfico permite observar patrones en la cantidad de llamadas realizadas.

library(ggplot2)
ggplot(telefonia, aes(x = factor(Llamadas), fill = factor(Llamadas))) +
  geom_bar() +
  labs(title = "Distribución de Llamadas en Telefonía", x = "Llamadas", y = "Frecuencia")

Histograma para Edad

Los histogramas son ideales para representar la distribución de variables cuantitativas, mostrando la frecuencia de valores en intervalos.

Este gráfico permite entender la distribución de edades en el conjunto de datos.

library(ggplot2)
ggplot(telefonia, aes(x = Edad)) +
  geom_histogram(fill = "skyblue", color = "black", bins = 30) +
  labs(title = "Histograma de Edad en Telefonía", x = "Edad", y = "Frecuencia")

Variables Cuantitativas Continuas

Histograma para Minutos

Similar al histograma de edad, este muestra la distribución de minutos en intervalos.

Facilita la comprensión de cómo se distribuyen los minutos utilizados.

library(ggplot2)
ggplot(telefonia, aes(x = Minutos)) +
  geom_histogram(fill = "skyblue", color = "black", bins = 30) +
  labs(title = "Histograma de Minutos en Telefonía", x = "Minutos", y = "Frecuencia")

Gráfico de Cajas para Monto

El diagrama de cajas resalta la mediana, cuartiles y posibles valores atípicos en la distribución del monto.

Permite identificar la dispersión y tendencia central de los montos registrados.

library(ggplot2)
ggplot(telefonia, aes(y = Monto)) +
  geom_boxplot(fill = "skyblue", color = "black") +
  labs(title = "Diagrama de Cajas de Monto en Telefonía", y = "Monto")

Gráfico de Densidad para Tiempo

El gráfico de densidad proporciona una estimación suave de la distribución de la variable continua.

Permite ver la forma de la distribución del tiempo y su relación con las opiniones.

library(ggplot2)
ggplot(telefonia, aes(x = Tiempo, fill = factor(Opinión))) +
  geom_density(alpha = 0.5) +
  labs(title = "Densidad de Tiempo en Telefonía", x = "Tiempo", y = "Densidad")