valores <- c(179, 285, 158, 167, 102, 153, 197, 127, 82, 157, 185, 90, 116, 172, 111, 148, 130, 165, 141, 149,
206, 175, 325, 210, 144, 300, 400, 167, 163, 150, 250, 130, 143, 187, 166, 88, 210, 100, 110, 120,
130, 140, 150, 160, 170, 180, 190, 90, 50, 60, 500, 450, 70, 420, 65, 90, 300, 280, 600, 50, 35,
45, 48, 60, 85, 100, 250, 300, 285, 400)
Tallo y hoja: Permite observar la distribución de los datos y detectar posibles valores atípicos. Se puede notar que existen valores muy elevados (por encima de 400), lo que sugiere la presencia de outliers.
stem(valores)
##
## The decimal point is 2 digit(s) to the right of the |
##
## 0 | 455556677899999
## 1 | 000112233334444555556666777777888999
## 2 | 011155899
## 3 | 0003
## 4 | 0025
## 5 | 0
## 6 | 0
##Histograma y Polígono de Frecuencia:
Muestran la frecuencia de los cobros en diferentes rangos. La el histograma puede indicar si los datos tienen una distribución simétrica o sesgada.
##Ojiva:
Representa la acumulación de frecuencias, permitiendo ver cómo se distribuyen los cobros y en qué rangos se concentran más valores.
##Gráfico circular:
Ayuda a visualizar las proporciones de los diferentes valores, aunque puede ser menos informativo que el histograma.
hist(valores, main="Histograma de Cobros de Gas", xlab="Miles de pesos", col="lightblue", border="black")
polygon(density(valores), col=rgb(1,0,0,0.5), border="red")
table_valores <- table(valores)
barplot(table_valores, main="Polígono de Frecuencia", xlab="Miles de pesos", ylab="Frecuencia", col="blue")
pie(table_valores, main="Gráfico Circular de Cobros de Gas")
plot(ecdf(valores), main="Ojiva", xlab="Miles de pesos", ylab="Frecuencia Acumulada", col="blue")
## c. Medidas de tendencia central y dispersión
media <- mean(valores)
mediana <- median(valores)
moda <- as.numeric(names(sort(table(valores), decreasing=TRUE)[1]))
desv_est <- sd(valores)
coef_var <- (desv_est / media) * 100
##d. Cuartiles, percentiles y otros
##Cuartiles:
Dividen los datos en cuatro partes. El primer cuartil (Q1) nos indica el 25% más bajo de los valores, la mediana (Q2) el 50% y el tercer cuartil (Q3) el 75%.
##Percentil 85, Decil 8, Sextil 4, Quintil 3:
Permiten conocer los valores de referencia según diferentes proporciones de la muestra.
q1 <- quantile(valores, 0.25)
q2 <- quantile(valores, 0.50)
q3 <- quantile(valores, 0.75)
percentil_85 <- quantile(valores, 0.85)
decil_8 <- quantile(valores, 0.8)
sextil_4 <- quantile(valores, 4/6)
quintil_3 <- quantile(valores, 3/5)
boxplot(valores, main="Caja de Bigotes de Cobros de Gas", col="orange")
## f. Medidas de forma
library(e1071)
asimetria <- skewness(valores)
curtosis <- kurtosis(valores)
cat("Media:", media, "\n")
## Media: 178.7286
cat("Mediana:", mediana, "\n")
## Mediana: 155
cat("Moda:", moda, "\n")
## Moda: 90
cat("Desviación estándar:", desv_est, "\n")
## Desviación estándar: 112.3203
cat("Coeficiente de variación:", coef_var, "%\n")
## Coeficiente de variación: 62.84407 %
cat("Cuartiles:", q1, q2, q3, "\n")
## Cuartiles: 104 155 203.75
cat("Percentil 85:", percentil_85, "\n")
## Percentil 85: 285
cat("Decil 8:", decil_8, "\n")
## Decil 8: 250
cat("Sextil 4:", sextil_4, "\n")
## Sextil 4: 179
cat("Quintil 3:", quintil_3, "\n")
## Quintil 3: 167
cat("Asimetría:", asimetria, "\n")
## Asimetría: 1.516661
cat("Curtosis:", curtosis, "\n")
## Curtosis: 2.403084
Este análisis muestra que los cobros de gas presentan una distribución con posible sesgo y la presencia de valores extremos. Las medidas de tendencia central indican que la mayoría de los apartamentos tienen cobros dentro de un rango específico, pero algunos presentan montos significativamente más altos.
El coeficiente de variación y la desviación estándar sugieren que hay una alta variabilidad en los cobros, lo que puede deberse a diferencias en el consumo de gas o en la tarificación. Finalmente, la caja de bigotes y las medidas de asimetría y curtosis confirman la existencia de valores atípicos, lo que debe tomarse en cuenta al interpretar los resultados.