*primero se descargan las librerias
library(dplyr)
library(ggplot2)
library(descriptr)
library(knitr)
library(modeest)
library(fdth)
library(readxl)
library(datos)
library(plotrix)
Base_Estadistica_Descriptiva_1_ <- read_excel("C:/Users/Hiroshi/Downloads/Base_Estadistica_Descriptiva (1).xlsx")
*De la base de datos adjunta llamada Base_Estadistica_Descriptiva, tome una muestra de 160 registros usando como semilla los dos últimos dígitos de la cédula y, con base en la muestra encontrada, conteste las siguientes preguntas
set.seed(88)
datos.jh<- Base_Estadistica_Descriptiva_1_
datos.jh<- sample_n(Base_Estadistica_Descriptiva_1_,size= 160, replace= FALSE)
attach(datos.jh)
t1 <- table(datos.jh$Genero, datos.jh$NivelEducativo)
t1 <- addmargins(t1)
t2 <- prop.table(t1, margin = 1) * 100
t2 <- addmargins(t2)
kable(t1, caption = "Frecuencias absolutas")
| Primaria | Secundaria | Técnico | Universitario | Sum | |
|---|---|---|---|---|---|
| Femenino | 10 | 13 | 16 | 12 | 51 |
| Masculino | 11 | 12 | 16 | 14 | 53 |
| Otro | 12 | 17 | 13 | 14 | 56 |
| Sum | 33 | 42 | 45 | 40 | 160 |
kable(round(t2,2), caption = "Porcentajes por fila (%)")
| Primaria | Secundaria | Técnico | Universitario | Sum | Sum | |
|---|---|---|---|---|---|---|
| Femenino | 9.80 | 12.75 | 15.69 | 11.76 | 50 | 100 |
| Masculino | 10.38 | 11.32 | 15.09 | 13.21 | 50 | 100 |
| Otro | 10.71 | 15.18 | 11.61 | 12.50 | 50 | 100 |
| Sum | 10.31 | 13.12 | 14.06 | 12.50 | 50 | 100 |
| Sum | 41.21 | 52.37 | 56.45 | 49.97 | 200 | 400 |
*Elabore un diagrama de caja y bigotes para la variable estatura en función del género y analice la gráfica
datos.jh<- data.frame(datos.jh)
datos.jh
## ID Genero NivelEducativo Edad Hermanos Estatura IngresoMensual
## 1 619907120 Femenino Secundaria 52 1 1.86 3385.24
## 2 377551114 Otro Secundaria 21 4 1.79 2443.79
## 3 709774807 Masculino Secundaria 45 6 1.64 1545.63
## 4 467433526 Masculino Primaria 36 2 1.81 1175.56
## 5 56013174 Otro Secundaria 32 3 1.54 1426.69
## 6 843721021 Femenino Universitario 35 4 1.55 2459.74
## 7 535532782 Otro Secundaria 18 2 1.64 1885.89
## 8 270954823 Femenino Universitario 30 3 1.99 1669.05
## 9 837612250 Otro Universitario 57 6 1.80 1939.16
## 10 950517921 Otro Primaria 46 6 1.82 2044.06
## 11 618199637 Masculino Universitario 61 4 1.81 2836.26
## 12 572469296 Otro Primaria 34 3 1.58 2165.90
## 13 33000524 Masculino Técnico 43 6 1.67 2488.16
## 14 412845013 Otro Primaria 59 4 1.57 2701.27
## 15 798322128 Otro Secundaria 47 3 1.63 2020.70
## 16 984588177 Otro Universitario 47 2 1.59 1667.73
## 17 19875599 Otro Secundaria 52 5 1.95 2465.17
## 18 777369582 Otro Universitario 20 5 1.59 1638.29
## 19 596680013 Masculino Universitario 57 0 1.64 2643.64
## 20 508588804 Femenino Primaria 50 2 1.83 1482.40
## 21 689399518 Masculino Secundaria 56 0 1.67 1874.61
## 22 697463245 Femenino Primaria 51 6 1.65 2079.41
## 23 848490384 Femenino Universitario 40 3 1.66 1733.58
## 24 912229362 Femenino Técnico 42 0 1.80 2143.60
## 25 531732551 Otro Técnico 49 5 1.67 1021.50
## 26 586479533 Otro Secundaria 26 6 1.59 2874.91
## 27 141727097 Otro Secundaria 33 3 1.58 1098.94
## 28 938889283 Masculino Técnico 35 5 1.52 1928.30
## 29 246709606 Masculino Técnico 40 0 1.83 1554.60
## 30 131449146 Femenino Universitario 28 4 1.70 2112.96
## 31 638987735 Femenino Secundaria 33 5 1.70 1953.89
## 32 612946719 Masculino Primaria 23 5 1.95 2256.41
## 33 252363708 Otro Universitario 57 4 1.51 2868.10
## 34 265057821 Femenino Técnico 61 1 1.88 2015.55
## 35 12474814 Masculino Técnico 23 3 1.97 421.59
## 36 464104544 Femenino Primaria 58 0 1.52 1217.28
## 37 757286656 Otro Técnico 42 2 1.76 2599.33
## 38 183359024 Otro Universitario 20 4 1.95 2946.39
## 39 439653733 Masculino Secundaria 19 1 1.76 2308.74
## 40 327465462 Otro Técnico 29 5 1.71 1109.75
## 41 848503131 Otro Universitario 38 6 1.89 2393.10
## 42 914953672 Otro Primaria 26 3 1.71 2159.88
## 43 210554674 Otro Universitario 34 6 1.50 2085.51
## 44 872077598 Otro Primaria 54 1 1.78 970.06
## 45 708778152 Femenino Primaria 52 2 1.97 1695.25
## 46 315507978 Masculino Universitario 40 6 1.93 3027.68
## 47 265535326 Otro Secundaria 46 1 1.92 2352.76
## 48 141152119 Masculino Primaria 27 4 1.77 3039.71
## 49 931037939 Otro Secundaria 30 6 1.70 2116.82
## 50 450825415 Femenino Primaria 32 3 1.82 2902.07
## 51 172679601 Femenino Universitario 65 0 1.64 1631.49
## 52 609468735 Otro Secundaria 34 0 1.71 2677.62
## 53 850854347 Otro Primaria 19 1 1.84 1299.57
## 54 405175094 Otro Universitario 59 5 1.78 651.92
## 55 859705546 Femenino Universitario 48 2 1.95 2226.69
## 56 164345662 Femenino Técnico 27 6 1.96 2598.39
## 57 446969937 Otro Técnico 41 6 1.77 1247.91
## 58 714169196 Femenino Técnico 39 5 1.59 2030.16
## 59 630214369 Masculino Secundaria 18 3 1.75 1221.43
## 60 821653222 Masculino Técnico 62 3 1.53 2358.27
## 61 609530021 Masculino Secundaria 41 2 1.64 298.21
## 62 256287799 Otro Técnico 31 6 1.63 240.23
## 63 560817170 Otro Técnico 19 1 1.61 2462.72
## 64 633239544 Masculino Técnico 23 2 1.68 1739.86
## 65 592062268 Femenino Técnico 62 0 1.74 2198.27
## 66 259767825 Masculino Primaria 44 6 1.54 3078.83
## 67 564266587 Femenino Técnico 30 4 1.80 901.18
## 68 524678766 Femenino Secundaria 34 6 1.53 1536.92
## 69 218549316 Masculino Secundaria 31 6 1.54 2337.20
## 70 501057416 Femenino Técnico 64 6 1.63 4393.22
## 71 596793476 Otro Universitario 35 5 1.54 2809.72
## 72 219635036 Femenino Primaria 34 3 1.91 2568.84
## 73 506648096 Masculino Universitario 51 6 1.54 3454.89
## 74 233045293 Otro Secundaria 18 3 1.69 2884.91
## 75 479956751 Femenino Secundaria 46 5 1.79 1330.04
## 76 873661646 Otro Primaria 29 4 1.71 4617.43
## 77 357742647 Masculino Técnico 29 1 1.53 1942.86
## 78 263016846 Otro Técnico 47 6 1.85 3643.29
## 79 594349788 Femenino Primaria 41 5 1.82 1574.39
## 80 450088326 Masculino Universitario 52 0 1.65 2196.37
## 81 1734028 Masculino Secundaria 35 5 1.83 1604.90
## 82 80776737 Masculino Técnico 33 5 1.83 1424.68
## 83 707534482 Otro Primaria 65 2 1.93 2135.42
## 84 796585578 Masculino Primaria 34 6 1.64 857.89
## 85 540488982 Femenino Técnico 53 1 1.54 1842.67
## 86 901873281 Masculino Secundaria 34 4 1.69 2399.97
## 87 80911557 Otro Primaria 47 2 1.63 1615.30
## 88 504908015 Otro Técnico 57 0 1.72 2485.16
## 89 204719623 Otro Técnico 27 5 1.94 1693.83
## 90 921543779 Masculino Técnico 43 3 1.52 2632.75
## 91 19243285 Femenino Técnico 54 1 1.59 2795.36
## 92 787350695 Otro Técnico 62 2 1.59 2520.62
## 93 622944221 Masculino Primaria 39 0 1.58 3486.26
## 94 245236064 Masculino Secundaria 49 3 1.71 2216.68
## 95 40450319 Otro Primaria 47 4 1.88 2370.57
## 96 601750908 Otro Primaria 55 0 1.98 1688.67
## 97 575358527 Masculino Secundaria 47 2 1.52 2266.67
## 98 367486223 Masculino Técnico 48 2 1.54 1697.53
## 99 453508533 Otro Secundaria 56 5 1.90 1501.85
## 100 452888736 Femenino Técnico 26 6 1.91 4377.27
## 101 88218079 Femenino Universitario 43 2 1.70 2021.54
## 102 363307453 Masculino Primaria 27 0 1.72 3079.79
## 103 879478061 Femenino Secundaria 23 5 1.51 2248.45
## 104 625830284 Femenino Primaria 55 4 1.65 1263.86
## 105 729522315 Masculino Primaria 37 5 1.86 2391.16
## 106 919153233 Masculino Técnico 46 1 1.67 1505.48
## 107 351299526 Masculino Secundaria 52 3 1.68 3025.32
## 108 862792106 Otro Secundaria 28 2 1.60 2748.27
## 109 127233810 Femenino Técnico 29 0 1.78 -274.41
## 110 617689437 Otro Técnico 65 0 1.71 2887.50
## 111 869563911 Femenino Secundaria 49 1 1.56 2476.03
## 112 30947528 Masculino Técnico 64 3 1.67 1254.14
## 113 512222259 Femenino Secundaria 36 5 1.65 2261.57
## 114 111533345 Femenino Secundaria 63 5 1.60 1070.64
## 115 260829855 Masculino Universitario 42 4 1.60 1877.41
## 116 893244099 Masculino Universitario 61 5 1.97 1642.37
## 117 620435846 Masculino Técnico 31 1 1.51 1872.89
## 118 124828346 Femenino Técnico 31 6 1.98 1815.51
## 119 244218602 Masculino Primaria 27 2 1.66 1014.99
## 120 584106868 Femenino Universitario 61 2 1.67 1089.04
## 121 795853617 Femenino Técnico 27 2 1.95 38.81
## 122 399590525 Otro Secundaria 56 3 1.85 2257.52
## 123 977571549 Masculino Técnico 51 0 1.81 426.93
## 124 159323258 Otro Universitario 40 0 1.59 2124.79
## 125 447110703 Otro Técnico 33 4 1.77 2449.34
## 126 383626825 Otro Universitario 57 1 1.50 1283.87
## 127 218675791 Masculino Universitario 19 5 1.81 1299.75
## 128 520817672 Femenino Primaria 59 2 1.62 3362.66
## 129 189241370 Femenino Universitario 40 4 1.77 3187.47
## 130 828545059 Masculino Universitario 55 6 1.59 2032.25
## 131 707172704 Masculino Primaria 55 2 1.62 3276.63
## 132 917265104 Masculino Técnico 33 5 1.89 1726.73
## 133 853941957 Masculino Universitario 51 1 1.80 1374.32
## 134 558324753 Otro Secundaria 40 6 1.88 3289.66
## 135 334238561 Femenino Secundaria 29 0 1.62 3291.58
## 136 941018706 Masculino Primaria 22 0 1.85 2148.43
## 137 943986343 Otro Técnico 56 0 1.58 2373.33
## 138 756652236 Femenino Universitario 50 5 1.74 2281.13
## 139 433603697 Femenino Secundaria 26 0 1.98 3785.42
## 140 326498071 Femenino Secundaria 27 3 1.94 2268.10
## 141 779975154 Masculino Universitario 21 6 1.84 1416.71
## 142 105592185 Masculino Secundaria 39 1 1.71 1719.88
## 143 377700854 Femenino Secundaria 59 0 1.64 1053.10
## 144 532358847 Femenino Técnico 62 1 1.63 1541.76
## 145 482707753 Femenino Técnico 29 4 1.78 2272.99
## 146 438360009 Femenino Universitario 22 3 1.72 -434.51
## 147 691486721 Masculino Técnico 33 5 1.74 1652.71
## 148 334689371 Masculino Universitario 45 3 1.87 539.60
## 149 746031848 Otro Universitario 37 4 1.56 2718.70
## 150 28475262 Femenino Secundaria 64 6 1.75 2516.23
## 151 62762030 Femenino Universitario 52 1 1.51 3169.88
## 152 777674339 Otro Universitario 52 1 1.63 3096.55
## 153 282647224 Masculino Universitario 31 6 1.99 2027.03
## 154 933527547 Femenino Técnico 21 2 1.52 2330.83
## 155 736567478 Otro Universitario 57 1 1.76 1625.37
## 156 458867088 Masculino Universitario 37 1 1.75 2224.80
## 157 482800515 Otro Primaria 44 4 1.61 2207.48
## 158 597762037 Femenino Primaria 46 2 1.79 2142.99
## 159 658642283 Otro Secundaria 61 2 1.91 1342.94
## 160 666884234 Otro Secundaria 30 2 1.84 1973.82
## HorasDeTrabajo
## 1 40.6
## 2 28.6
## 3 36.4
## 4 46.6
## 5 33.5
## 6 40.8
## 7 38.2
## 8 47.2
## 9 47.1
## 10 38.1
## 11 36.2
## 12 36.1
## 13 35.6
## 14 51.7
## 15 34.1
## 16 53.3
## 17 17.9
## 18 35.5
## 19 26.1
## 20 18.5
## 21 32.6
## 22 26.9
## 23 19.2
## 24 48.2
## 25 46.6
## 26 49.3
## 27 38.8
## 28 49.3
## 29 28.1
## 30 44.5
## 31 44.2
## 32 43.0
## 33 47.6
## 34 41.9
## 35 47.8
## 36 44.1
## 37 24.5
## 38 33.5
## 39 46.0
## 40 39.6
## 41 40.0
## 42 37.0
## 43 32.5
## 44 38.1
## 45 41.7
## 46 38.1
## 47 40.4
## 48 36.4
## 49 31.6
## 50 50.0
## 51 27.3
## 52 28.8
## 53 19.4
## 54 47.8
## 55 32.6
## 56 27.9
## 57 47.4
## 58 36.7
## 59 44.7
## 60 52.0
## 61 44.7
## 62 42.6
## 63 32.0
## 64 42.5
## 65 38.1
## 66 16.1
## 67 46.5
## 68 47.6
## 69 51.6
## 70 28.9
## 71 35.5
## 72 25.8
## 73 34.5
## 74 41.3
## 75 43.0
## 76 37.2
## 77 48.1
## 78 31.0
## 79 36.4
## 80 40.7
## 81 27.5
## 82 28.2
## 83 49.4
## 84 77.2
## 85 31.9
## 86 49.0
## 87 51.0
## 88 42.5
## 89 31.7
## 90 26.5
## 91 41.7
## 92 50.4
## 93 53.2
## 94 36.8
## 95 25.1
## 96 54.5
## 97 38.8
## 98 48.8
## 99 48.3
## 100 39.1
## 101 34.1
## 102 41.5
## 103 32.9
## 104 36.0
## 105 26.7
## 106 41.0
## 107 34.4
## 108 49.4
## 109 29.2
## 110 39.5
## 111 54.1
## 112 32.0
## 113 41.5
## 114 21.4
## 115 42.8
## 116 35.4
## 117 49.2
## 118 29.8
## 119 51.4
## 120 32.0
## 121 45.1
## 122 41.1
## 123 32.4
## 124 38.8
## 125 66.9
## 126 37.3
## 127 38.5
## 128 38.1
## 129 29.6
## 130 34.9
## 131 39.5
## 132 38.1
## 133 46.3
## 134 45.8
## 135 38.4
## 136 48.2
## 137 48.4
## 138 28.2
## 139 46.8
## 140 33.9
## 141 28.8
## 142 51.2
## 143 37.3
## 144 38.9
## 145 50.0
## 146 40.1
## 147 49.3
## 148 34.2
## 149 22.9
## 150 24.7
## 151 30.6
## 152 39.4
## 153 51.2
## 154 41.2
## 155 37.3
## 156 36.5
## 157 41.3
## 158 40.2
## 159 39.9
## 160 34.9
boxplot(datos.jh$Estatura~datos.jh$Genero,xlab= "Genero", ylab = "Estatura", col= rainbow(n=3), main= "Diagrama de caja y bigote: Estatura en funcion del genero")
cat("En orden de estatura el genero otros son los mas altos con alrededor de 1.8 de estatura,despues sigue el genero femenino con alrededor de 1.75 de estatura, finalmente el genero masculino con alrededor de 1.72 de estatura. Por otro lado, podemos observar que la mayor variabilidad de los datos se encuentra en el genero masculino, despues le sigue el femenino y finalmente el genero otros")
## En orden de estatura el genero otros son los mas altos con alrededor de 1.8 de estatura,despues sigue el genero femenino con alrededor de 1.75 de estatura, finalmente el genero masculino con alrededor de 1.72 de estatura. Por otro lado, podemos observar que la mayor variabilidad de los datos se encuentra en el genero masculino, despues le sigue el femenino y finalmente el genero otros
*Elabore un diagrama de barras para la variable Hermanos y determine qué cantidad es la más frecuente.
tabla.her<-table(datos.jh$Hermanos)
tabla.her
##
## 0 1 2 3 4 5 6
## 22 21 25 21 19 25 27
barplot(tabla.her, ylab= "Frecuancia", xlab= "Cantidad de hermanos", density = 45, col= rainbow(n=7), main= "Grafico de barras cantidad de hermanos")
Elabore un diagrama de torta en 3D para la variable NivelEducativo.
attach(datos.jh)
tabla.edu<-table(datos.jh$NivelEducativo)
tabla.edu
##
## Primaria Secundaria Técnico Universitario
## 33 42 45 40
pie3D(tabla.edu, main= "Diagrama de tortas nivel educativo", col= rainbow(n=4))
legend("topright",legend = c("Universitario", "Secundario", "Primario", "tecnico") ,title = "nivel educativo",cex = 0.5, col= c("red","green", "blue", "purple"))
Elabore una tabla de frecuencias, el histograma y el polígono de frecuencias para la variable HorasDeTrabajo
tabla_frec_horast<- fdt(datos.jh$HorasDeTrabajo)
tabla_frec_horast
## Class limits f rf rf(%) cf cf(%)
## [15.939,22.832) 6 0.04 3.75 6 3.75
## [22.832,29.724) 21 0.13 13.12 27 16.88
## [29.724,36.617) 35 0.22 21.88 62 38.75
## [36.617,43.509) 49 0.31 30.63 111 69.38
## [43.509,50.402) 36 0.22 22.50 147 91.88
## [50.402,57.294) 11 0.07 6.88 158 98.75
## [57.294,64.187) 0 0.00 0.00 158 98.75
## [64.187,71.079) 1 0.01 0.62 159 99.38
## [71.079,77.972) 1 0.01 0.62 160 100.00
kable(tabla_frec_horast)
|
|
plot(tabla_frec_horast, main= "histograma Horas de trabajo", col = rainbow(n=9), xlab = "Horas de trabajo", ylab= "Frecuencia")
tablaHD <- fdt(datos.jh$HorasDeTrabajo)
plot(datos.jh$HorasDeTrabajo, type = "o",
xlab = "Horas de Trabajo", ylab = "Frecuencia",
main = "Polígono de Frecuencias",
col = "blue")
Elabore un dataframe con las medidas de tendencia central, de
variabilidad, Q1 ,Q3 y las medidas de forma para la variable
IingresoMensual.
df_IM <- data.frame(Ingreso_Mensual = datos.jh$IngresoMensual)
percentiles <- quantile(datos.jh$IngresoMensual)
resumen_IM<- ds_tidy_stats(datos.jh, IngresoMensual)
kable(resumen_IM)
| vars | min | max | mean | t_mean | median | mode | range | variance | stdev | skew | kurtosis | coeff_var | q1 | q3 | iqrange |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| IngresoMensual | -434.51 | 4617.43 | 2058.766 | 2062.522 | 2114.89 | -434.51 | 5051.94 | 704681.9 | 839.4533 | 0.0021836 | 0.8802592 | 40.77458 | 1552.358 | 2495.177 | 942.82 |