Se tomó una muestra aleatoria de los salarios de los empleados de una empresa y se encontró la siguiente distribución de los datos:
7,000 a cada uno de los 50 empleados operativos 25,000 a cada uno de los 35 empleados de confianza 60,000 a cada uno de los 16 gerentes de área 100,000 al gerente general
organizacion de la informacion
salarios = c(7000,25000,60000,100000)
f = c(50,35,16,1)
n = sum(f)
fr = f/n #frecuencia relativa (porcentaje)
fra = cumsum(fr) #frecuencia relativa acumulada
tabla
T1= data.frame(salarios,f,n,fr,fra)
names(T1) = c("salarios","f","fr","fra")
T1
## salarios f fr fra <NA>
## 1 7000 50 102 0.490196078 0.4901961
## 2 25000 35 102 0.343137255 0.8333333
## 3 60000 16 102 0.156862745 0.9901961
## 4 100000 1 102 0.009803922 1.0000000
**grafico de barras*
barplot(fr,salarios,names= salarios, main= "salarios de los trabajadores", col = c(rainbow(4)))
caja y bigote
datos=c(rep(7000,50),rep(25000,35), rep(60000,16),100000)
datos
## [1] 7000 7000 7000 7000 7000 7000 7000 7000 7000 7000
## [11] 7000 7000 7000 7000 7000 7000 7000 7000 7000 7000
## [21] 7000 7000 7000 7000 7000 7000 7000 7000 7000 7000
## [31] 7000 7000 7000 7000 7000 7000 7000 7000 7000 7000
## [41] 7000 7000 7000 7000 7000 7000 7000 7000 7000 7000
## [51] 25000 25000 25000 25000 25000 25000 25000 25000 25000 25000
## [61] 25000 25000 25000 25000 25000 25000 25000 25000 25000 25000
## [71] 25000 25000 25000 25000 25000 25000 25000 25000 25000 25000
## [81] 25000 25000 25000 25000 25000 60000 60000 60000 60000 60000
## [91] 60000 60000 60000 60000 60000 60000 60000 60000 60000 60000
## [101] 60000 100000
boxplot(datos, main="salario medio", col="orange",horizontal=TRUE)
#a
media = mean(datos)
mediana = median(datos)
rm = (max(datos)+min(datos))/2
cat("media =", mediana, "\n")
## media = 25000
cat("mediana =", mediana, "\n")
## mediana = 25000
cat("rango medio =", rm)
## rango medio = 53500
#b
La medida que mejor representa los salarios de la empresa es la mediana. Aunque la media también es de 25,000, existe un salario muy alto (100,000) que provoca una ligera asimetría en los datos. La mediana no se ve afectada por valores extremos y representa mejor el salario típico que recibe la mayoría de los trabajadores. En este caso, como la mayoría gana entre 7,000 y 25,000, la mediana (25,000) describe mejor la realidad salarial de la empresa.
#c
desvest=sd(datos)
verianza=var(datos)
#d
inf = media - desvest
sup = media + desvest
cat("inferior =", inf, "\n")
## inferior = 2318.837
cat("superior =, sup")
## superior =, sup