title: “Untitled” author: “Andres Aybar” date: “2025-05-07” output: html_document —
A continuación, se proporcionan las ventas anuales, en millones de dólares, de 30 compañías farmacéuticas.
ventas <- c(8408, 1374, 1872, 8879, 2459, 11413,
608, 14138, 6452, 1850, 2818, 1356,
10498, 7478, 4019, 4341, 739, 2127,
3653, 5794, 8305, 1388, 2284, 3274,
5285, 1278, 6272, 2102, 3297, 3668)
Suma <- sum(ventas[1:21])
Suma
## [1] 108581
max(ventas)
## [1] 14138
min(ventas)
## [1] 608
sort(ventas)
## [1] 608 739 1278 1356 1374 1388 1850 1872 2102 2127 2284 2459
## [13] 2818 3274 3297 3653 3668 4019 4341 5285 5794 6272 6452 7478
## [25] 8305 8408 8879 10498 11413 14138
sort(ventas, decreasing = TRUE)
## [1] 14138 11413 10498 8879 8408 8305 7478 6452 6272 5794 5285 4341
## [13] 4019 3668 3653 3297 3274 2818 2459 2284 2127 2102 1872 1850
## [25] 1388 1374 1356 1278 739 608
cat("Promedio de ventas:", mean(ventas), "\n")
## Promedio de ventas: 4580.967
cat("Mediana de ventas:", median(ventas), "\n")
## Mediana de ventas: 3475
cat("Varianza:", var(ventas), "\n")
## Varianza: 12218730
cat("Desviación estándar:", sd(ventas), "\n")
## Desviación estándar: 3495.53
ventas[ventas > 4000]
## [1] 8408 8879 11413 14138 6452 10498 7478 4019 4341 5794 8305 5285
## [13] 6272
intermedias <- ventas[ventas >= 4500 & ventas <= 8500]
length(intermedias)
## [1] 7
IQR(ventas)
## [1] 4477.5
puntaje_z <- function(x) {round(((x-mean(x))/sd(x)),2)}
cbind(ventas,Puntaje_z = puntaje_z(ventas))
## ventas Puntaje_z
## [1,] 8408 1.09
## [2,] 1374 -0.92
## [3,] 1872 -0.77
## [4,] 8879 1.23
## [5,] 2459 -0.61
## [6,] 11413 1.95
## [7,] 608 -1.14
## [8,] 14138 2.73
## [9,] 6452 0.54
## [10,] 1850 -0.78
## [11,] 2818 -0.50
## [12,] 1356 -0.92
## [13,] 10498 1.69
## [14,] 7478 0.83
## [15,] 4019 -0.16
## [16,] 4341 -0.07
## [17,] 739 -1.10
## [18,] 2127 -0.70
## [19,] 3653 -0.27
## [20,] 5794 0.35
## [21,] 8305 1.07
## [22,] 1388 -0.91
## [23,] 2284 -0.66
## [24,] 3274 -0.37
## [25,] 5285 0.20
## [26,] 1278 -0.94
## [27,] 6272 0.48
## [28,] 2102 -0.71
## [29,] 3297 -0.37
## [30,] 3668 -0.26
fivenum(ventas)
## [1] 608 1872 3475 6452 14138
quantile(ventas, probs = c(0.25, 0.5, 0.75))
## 25% 50% 75%
## 1929.5 3475.0 6407.0
quantile(ventas, probs = c(0.10, 0.20, 0.50, 0.80, 0.90))
## 10% 20% 50% 80% 90%
## 1348.2 1757.6 3475.0 7643.4 9040.9
hist(ventas)
cbind(ventas,Puntaje_z = puntaje_z(ventas))
## ventas Puntaje_z
## [1,] 8408 1.09
## [2,] 1374 -0.92
## [3,] 1872 -0.77
## [4,] 8879 1.23
## [5,] 2459 -0.61
## [6,] 11413 1.95
## [7,] 608 -1.14
## [8,] 14138 2.73
## [9,] 6452 0.54
## [10,] 1850 -0.78
## [11,] 2818 -0.50
## [12,] 1356 -0.92
## [13,] 10498 1.69
## [14,] 7478 0.83
## [15,] 4019 -0.16
## [16,] 4341 -0.07
## [17,] 739 -1.10
## [18,] 2127 -0.70
## [19,] 3653 -0.27
## [20,] 5794 0.35
## [21,] 8305 1.07
## [22,] 1388 -0.91
## [23,] 2284 -0.66
## [24,] 3274 -0.37
## [25,] 5285 0.20
## [26,] 1278 -0.94
## [27,] 6272 0.48
## [28,] 2102 -0.71
## [29,] 3297 -0.37
## [30,] 3668 -0.26
Si considero los valores que obtuvieron un puntaje Z de 3 (3 desviaciones estandar), no hay valores atípicos. Sin embargo, cuando le aplico las demas pruebas (límite superior e inferior; y el boxplot), aparte de lo observado en el histograma, la compañía que obtuvo 14,138 millones en ventas es un caso atípico
lim_inf <-quantile(ventas,0.25)-1.5*IQR(ventas)
lim_sup <-quantile(ventas,0.75)+1.5*IQR(ventas)
cat("[",round(lim_inf,1),round(lim_sup),"]\n")
## [ -4786.8 13123 ]
cat("Los valores atipicos son:",ventas[ventas<lim_inf | ventas>lim_sup],"\n")
## Los valores atipicos son: 14138
boxplot(ventas)