library(readr)
data$`Tiempo de estancia` <- parse_number(as.character(data$`Tiempo de estancia`))
t <- descr(data[,c(10,19)])
pander(t)
| Edad | Tiempo de estancia | |
|---|---|---|
| Mean | 41.5 | 9.254 |
| Std.Dev | 14.98 | 38.91 |
| Min | 6 | 1 |
| Q1 | 29 | 3 |
| Median | 39 | 4 |
| Q3 | 53 | 7 |
| Max | 92 | 1095 |
| MAD | 16.31 | 2.965 |
| IQR | 24 | 4 |
| CV | 0.3609 | 4.204 |
| Skewness | 0.3894 | 20.81 |
| SE.Skewness | 0.03748 | 0.05978 |
| Kurtosis | -0.7508 | 500.3 |
| N.Valid | 4269 | 1676 |
| Pct.Valid | 100 | 39.26 |
Mes | Frecuencia Absoluta |
|---|---|
Enero | 93 |
Febrero | 54 |
Marzo | 54 |
Abril | 54 |
Mayo | 54 |
Junio | 54 |
Julio | 278 |
Agosto | 346 |
Septiembre | 461 |
Octubre | 1,086 |
Noviembre | 517 |
Diciembre | 1,218 |
Sexo | Frecuencia Absoluta |
|---|---|
Femenino | 2,123 |
Masculino | 2,146 |
En una muestra de los visitantes del aeropuerto Alfonso Bonilla de la ciudad de Cali en 2018 se recolectó la siguiente información: para la variable de edad el promedio fue de 41.5 años, los datos tienen un sesgo de 0.38, por lo que son asimétricos. En cuanto al coeficiente de variación, se encontró una variación del 36% por lo que la muestra es considerada heterogénea. Para la variable tiempo de estancia, se encontró un tiempo promedio de 9 días, con una desviación estándar de 38.91, lo cual es significativo. Se encontró un sesgo de 20. 81 por lo que la muestra es asimétrica, y además el coeficiente de variación es del 420 %, presentando una muestra heterogénea. Esto nos muestra que el tiempo de estancia es altamente disperso.