Variable de estudio:El tiempo que gastan los empleados en su recorrido de la mañana a la oficina.
Escala de medición: Cuantitativa continua y en la escala de razón. Esto se debe a que el tiempo es una variable numérica continua (puede tomar cualquier valor dentro de un rango y tiene un punto cero absoluto, el cual indica la ausencia de tiempo).
valores <- c(30,31,45,48,48,50,53,54,55,57,58,59,61,64,67,69,73,76,79,80,83,87)
media <- mean(valores)
print(paste("Media:", media))
## [1] "Media: 60.3181818181818"
La media de 60.31 minutos indica que, en promedio, los empleados gastan aproximadamente 60 minutos en su recorrido hacia la oficina. Es un valor representativo del tiempo de desplazamiento, aunque es importante considerar que esta media puede no reflejar con precisión la experiencia de todos los empleados si hay una alta dispersión de los datos (lo cual veremos con la desviación estándar).
mediana <- median(valores)
print(paste("Mediana:", mediana))
## [1] "Mediana: 58.5"
La mediana de 58.5 minutos nos indica que el 50% de los empleados gastan menos de 5.9 minutos y el otro 50% gastan más. Esto es útil porque la mediana no se ve afectada por valores extremadamente altos o bajos, y por lo tanto es una medida más robusta en presencia de distribuciones sesgadas o valores atípicos.
desv_est <- sd(valores)
print(paste("Desviación estándar:", desv_est))
## [1] "Desviación estándar: 15.5330258409265"
cv<-(desv_est / media)* 100
print(paste("CoeficientedeVariacion:", round(cv,2),"%"))
## [1] "CoeficientedeVariacion: 25.75 %"
Un 25.75% de CV nos dice que los tiempos de desplazamiento tienen una variabilidad notable en relación con la media, lo cual puede deberse a diferentes condiciones de tráfico, rutas tomadas o ubicaciones de residencia de los empleados.
boxplot(valores,
main = "Diagrama de Caja con Valores Atipicos",
ylab = "Tiempo (minutos)",
col = "lightblue",
border = "darkblue",
notch = TRUE)
## Valores Atipicos
Los valores atípicos (outliers) son aquellos datos que se alejan significativamente del resto del conjunto de datos. En este caso, queremos saber si hay empleados cuyo tiempo de recorrido al trabajo es anormalmente alto o bajo en comparación con los demás. Para detectar valores atípicos, usamos el rango intercuartílico (IQR), que nos ayuda a identificar si algún dato está demasiado lejos del grupo principal. Cualquier valor por debajo de 18,87 o por encima de 103,87 es un outlier, por ende no hay valores atípicos.Calculando los limites inferiores y superiores.
print("Valores atípicos detectados:")
## [1] "Valores atípicos detectados:"
Q1 <- quantile(valores, 0.25)
Q3 <- quantile(valores, 0.75)
IQR <- Q3- Q1
limite_inferior <- Q1- 1.5 * IQR
limite_superior <- Q3 + 1.5 * IQR
cat("Límite Inferior:", limite_inferior, "\n")
## Límite Inferior: 18.875
cat("Límite Superior:", limite_superior, "\n")
## Límite Superior: 103.875
cat("Límite Superior:", limite_superior, "\n")
## Límite Superior: 103.875
En resumen, aunque los empleados tienen un tiempo promedio de 60.31 minutos, hay una notable variabilidad en los tiempos de desplazamiento. El boxplot confirma que no hay valores extremos, y el análisis sugiere que algunos empleados tienen tiempos de desplazamiento significativamente más largos o más cortos que el promedio.