title: “Untitled” author: “Andres Aybar” date: “2025-05-07” output: html_document —

Ventas Anuales

A continuación, se proporcionan las ventas anuales, en millones de dólares, de 30 compañías farmacéuticas.

ventas <- c(8408, 1374, 1872, 8879, 2459, 11413,
  608, 14138, 6452, 1850, 2818, 1356,
  10498, 7478, 4019, 4341, 739, 2127,
  3653, 5794, 8305, 1388, 2284, 3274,
  5285, 1278, 6272, 2102, 3297, 3668)

Determine la suma de todas las ventas de las 21 compañías

Suma <- sum(ventas[1:21])

Suma
## [1] 108581

Determine la mayor y la menor de las ventas

max(ventas)
## [1] 14138
min(ventas)
## [1] 608

Ordene las ventas de menor a mayor

sort(ventas)
##  [1]   608   739  1278  1356  1374  1388  1850  1872  2102  2127  2284  2459
## [13]  2818  3274  3297  3653  3668  4019  4341  5285  5794  6272  6452  7478
## [25]  8305  8408  8879 10498 11413 14138

Ordene las ventas de mayor a menor

sort(ventas, decreasing = TRUE)
##  [1] 14138 11413 10498  8879  8408  8305  7478  6452  6272  5794  5285  4341
## [13]  4019  3668  3653  3297  3274  2818  2459  2284  2127  2102  1872  1850
## [25]  1388  1374  1356  1278   739   608

Usando la función cat muestre el promedio y la mediana de las ventas

cat("Promedio de ventas:", mean(ventas), "\n")
## Promedio de ventas: 4580.967
cat("Mediana de ventas:", median(ventas), "\n")
## Mediana de ventas: 3475

Usando la función cat muestre la varianza y la desviación estándar de las ventas

cat("Varianza:", var(ventas), "\n")
## Varianza: 12218730
cat("Desviación estándar:", sd(ventas), "\n")
## Desviación estándar: 3495.53

Obtenga las ventas mayores a 4,000

ventas[ventas > 4000]
##  [1]  8408  8879 11413 14138  6452 10498  7478  4019  4341  5794  8305  5285
## [13]  6272

Indique cuantas compañías vendieron un monto entre 4,500 y 8,500

intermedias <- ventas[ventas >= 4500 & ventas <= 8500]


length(intermedias)
## [1] 7

Indique el rango intercuartílico de las ventas

IQR(ventas)
## [1] 4477.5

Indique el puntaje Z de cada venta

puntaje_z <- function(x) {round(((x-mean(x))/sd(x)),2)}

cbind(ventas,Puntaje_z = puntaje_z(ventas))
##       ventas Puntaje_z
##  [1,]   8408      1.09
##  [2,]   1374     -0.92
##  [3,]   1872     -0.77
##  [4,]   8879      1.23
##  [5,]   2459     -0.61
##  [6,]  11413      1.95
##  [7,]    608     -1.14
##  [8,]  14138      2.73
##  [9,]   6452      0.54
## [10,]   1850     -0.78
## [11,]   2818     -0.50
## [12,]   1356     -0.92
## [13,]  10498      1.69
## [14,]   7478      0.83
## [15,]   4019     -0.16
## [16,]   4341     -0.07
## [17,]    739     -1.10
## [18,]   2127     -0.70
## [19,]   3653     -0.27
## [20,]   5794      0.35
## [21,]   8305      1.07
## [22,]   1388     -0.91
## [23,]   2284     -0.66
## [24,]   3274     -0.37
## [25,]   5285      0.20
## [26,]   1278     -0.94
## [27,]   6272      0.48
## [28,]   2102     -0.71
## [29,]   3297     -0.37
## [30,]   3668     -0.26

Calcule el resumen de cinco números para los datos

fivenum(ventas)
## [1]   608  1872  3475  6452 14138

Calcule los cuantiles 1ro, 2do y tercero

quantile(ventas, probs = c(0.25, 0.5, 0.75))
##    25%    50%    75% 
## 1929.5 3475.0 6407.0

Calcule los percentiles 10,20,50,80,90

quantile(ventas, probs = c(0.10, 0.20, 0.50, 0.80, 0.90))
##    10%    20%    50%    80%    90% 
## 1348.2 1757.6 3475.0 7643.4 9040.9

Construya un histograma

hist(ventas)

Indique el puntaje Z de cada venta

cbind(ventas,Puntaje_z = puntaje_z(ventas))
##       ventas Puntaje_z
##  [1,]   8408      1.09
##  [2,]   1374     -0.92
##  [3,]   1872     -0.77
##  [4,]   8879      1.23
##  [5,]   2459     -0.61
##  [6,]  11413      1.95
##  [7,]    608     -1.14
##  [8,]  14138      2.73
##  [9,]   6452      0.54
## [10,]   1850     -0.78
## [11,]   2818     -0.50
## [12,]   1356     -0.92
## [13,]  10498      1.69
## [14,]   7478      0.83
## [15,]   4019     -0.16
## [16,]   4341     -0.07
## [17,]    739     -1.10
## [18,]   2127     -0.70
## [19,]   3653     -0.27
## [20,]   5794      0.35
## [21,]   8305      1.07
## [22,]   1388     -0.91
## [23,]   2284     -0.66
## [24,]   3274     -0.37
## [25,]   5285      0.20
## [26,]   1278     -0.94
## [27,]   6272      0.48
## [28,]   2102     -0.71
## [29,]   3297     -0.37
## [30,]   3668     -0.26

¿Hay algún resultado atípico?

Si considero los valores que obtuvieron un puntaje Z de 3 (3 desviaciones estandar), no hay valores atípicos. Sin embargo, cuando le aplico las demas pruebas (límite superior e inferior; y el boxplot), aparte de lo observado en el histograma, la compañía que obtuvo 14,138 millones en ventas es un caso atípico

lim_inf <-quantile(ventas,0.25)-1.5*IQR(ventas)

lim_sup <-quantile(ventas,0.75)+1.5*IQR(ventas)

cat("[",round(lim_inf,1),round(lim_sup),"]\n")
## [ -4786.8 13123 ]
cat("Los valores atipicos son:",ventas[ventas<lim_inf | ventas>lim_sup],"\n")
## Los valores atipicos son: 14138
boxplot(ventas)