B.Variable de estudio y su escala de medición

Variable de estudio:El tiempo que gastan los empleados en su recorrido de la mañana a la oficina.

Escala de medición: Cuantitativa continua y en la escala de razón. Esto se debe a que el tiempo es una variable numérica continua (puede tomar cualquier valor dentro de un rango y tiene un punto cero absoluto, el cual indica la ausencia de tiempo).

C. Calcule e interprete Medía, Mediana y coeficiente de variación

1. Agregar Datos

valores <- c(30,31,45,48,48,50,53,54,55,57,58,59,61,64,67,69,73,76,79,80,83,87)

2.Calcular la media

media <- mean(valores)
 print(paste("Media:", media))
## [1] "Media: 60.3181818181818"

Interpretación

La media de 60.31 minutos indica que, en promedio, los empleados gastan aproximadamente 60 minutos en su recorrido hacia la oficina. Es un valor representativo del tiempo de desplazamiento, aunque es importante considerar que esta media puede no reflejar con precisión la experiencia de todos los empleados si hay una alta dispersión de los datos (lo cual veremos con la desviación estándar).

Hallar la mediana

mediana <- median(valores)
 print(paste("Mediana:", mediana))
## [1] "Mediana: 58.5"

Interpretación

La mediana de 58.5 minutos nos indica que el 50% de los empleados gastan menos de 5.9 minutos y el otro 50% gastan más. Esto es útil porque la mediana no se ve afectada por valores extremadamente altos o bajos, y por lo tanto es una medida más robusta en presencia de distribuciones sesgadas o valores atípicos.

Hallar la desviación estandar

desv_est <- sd(valores)
 print(paste("Desviación estándar:", desv_est))
## [1] "Desviación estándar: 15.5330258409265"

Hallar el coeficiente de variación

 cv<-(desv_est / media)* 100
print(paste("CoeficientedeVariacion:", round(cv,2),"%"))
## [1] "CoeficientedeVariacion: 25.75 %"

Interpretación

Un 25.75% de CV nos dice que los tiempos de desplazamiento tienen una variabilidad notable en relación con la media, lo cual puede deberse a diferentes condiciones de tráfico, rutas tomadas o ubicaciones de residencia de los empleados.

D.Elabore una caja de bigotes e interprétela. ¿Hay datos extremos?

boxplot(valores, 
        main = "Diagrama de Caja con Valores Atipicos", 
        ylab = "Tiempo (minutos)", 
        col = "lightblue", 
        border = "darkblue", 
        notch = TRUE)

## Valores Atipicos

Los valores atípicos (outliers) son aquellos datos que se alejan significativamente del resto del conjunto de datos. En este caso, queremos saber si hay empleados cuyo tiempo de recorrido al trabajo es anormalmente alto o bajo en comparación con los demás. Para detectar valores atípicos, usamos el rango intercuartílico (IQR), que nos ayuda a identificar si algún dato está demasiado lejos del grupo principal. Cualquier valor por debajo de 18,87 o por encima de 103,87 es un outlier, por ende no hay valores atípicos.Calculando los limites inferiores y superiores.

print("Valores atípicos detectados:")
## [1] "Valores atípicos detectados:"

Calcular limite inferior y superior

Q1 <- quantile(valores, 0.25)
 Q3 <- quantile(valores, 0.75)
 IQR <- Q3- Q1
 limite_inferior <- Q1- 1.5 * IQR
 limite_superior <- Q3 + 1.5 * IQR
 cat("Límite Inferior:", limite_inferior, "\n")
## Límite Inferior: 18.875
 cat("Límite Superior:", limite_superior, "\n")
## Límite Superior: 103.875
 cat("Límite Superior:", limite_superior, "\n")
## Límite Superior: 103.875

Conclusión

En resumen, aunque los empleados tienen un tiempo promedio de 60.31 minutos, hay una notable variabilidad en los tiempos de desplazamiento. El boxplot confirma que no hay valores extremos, y el análisis sugiere que algunos empleados tienen tiempos de desplazamiento significativamente más largos o más cortos que el promedio.