Objetivo

Encontrar límites de clase

Descripción

Se simula la creación de una muestra con una variable de los ingresos mensuales en pesos mexicanos que reciben un conjunto de trabajadores.

Se crea una tabla de frecuencia de los datos ingresos, se visualiza un histograma de los ingresos así como se crean los estadísticos mínimo, máximo, rango, clases, e intervalo de clase.

Desarrollo

Cargar librerías

library(fdth)    # Para tablas de frecuencias
library(lattice) # Para gráficos

Crear datos

Con la función rnorm() se simula y se generan datos aleatorios bajo una distribución normal cuyo valor estimado de media es de \(16000\) mil pesos y una variación de \(2000\) mil pesos.

La función set.seed(2021) es una semilla que perite generar los mismos valores aletorios

set.seed(2021)
ingresos <- round(rnorm(n = 650, mean = 16000, sd = 2000), 0)
ingresos
##   [1] 15755 17105 16697 16719 17796 12155 16523 17831 16028 19460 13836 15454
##  [13] 16364 19017 19209 12317 19247 16263 18962 19027 14115 15629 13798 18416
##  [25] 12750 16211 13089 15292 15813 18201 12072 13104 18039 13157 14791 12833
##  [37] 13428 13091 15826 17009 16233 19520 15310 20240 15931 14416 18951 14549
##  [49] 16625 17384 14999 11488 16087 15262 14080 16208 16855 15659 12902 12989
##  [61] 16032 15629 16784 14487 16463 14033 17130 19234 15496 13888 15304 15914
##  [73] 13205 18980 13921 15526 14002 13215 17964 16722 15325 14713 11666 17267
##  [85] 15710 13520 17068 12823 14018 16967 17621 15413 15893 17470 16030 15756
##  [97] 14706 14264 14983 11845 15479 16901 15714 15027 13608 16094 15747 10599
## [109] 14858 17183 16974 15746 13482 16403 12166 19345 16942 18828 16169 12395
## [121] 17507 15376 12535 11723 20732 16970 18186 16606 18031 20907 15509 17083
## [133] 16394 11858 17025 15188 16712 15337 16161 15477 14245 17483 10634 14101
## [145] 16893 13422 15684 16696 15881 18953 14692 15486 13492 17542 14177 14613
## [157] 14765 17524 13826 15200 17656 16711 16318 17911 15321 14545 12604 19908
## [169] 21333 20127 17638 15841 15021 17695 14082 17857 16762 18989 15065 16522
## [181] 14015 13873 16549 17891 17452 15491 18970 16461 16556 16294 13607 16180
## [193] 18439 14877 16674 12926 15520 17030 15522 17164 16540 13313 14302 15185
## [205] 14668 15794 14152 16877 15976 14708 18688 16669 16006 18194 18327 16202
## [217] 15216 15178 14173 14919 16243 19455 15912 17090 19835 15527 19143 16962
## [229] 16085 16880 12239 12552 19766 15937 17998 16601 15990 15519 12458 15688
## [241] 19831 18220 12029 17629 18197 13119 18430 14434 11866 16669 16522 15131
## [253] 12254 14394 16665 16024 17700 12938 15937 18855 14146 18011 15828 17876
## [265] 14963 14131 18463 15521 16546 18862 13718 17792 16166 16700 13483 17679
## [277] 13483 16306 15033 20422 16162 17432 18109 16552 15159 21045 16004 12876
## [289] 12024 13016 16510 14371 17668 13695 15719 18352 16374 14610 15081 15050
## [301] 18412 17988 19078 16584 17021 14918 14652 17360 16373 13229 13885 16748
## [313] 13995 15915 15989 13917 15350 14783 19035 16593 16799 17497 15824 13829
## [325] 15829 16931 16000 17233 14696 16894 15635 14387 12381 14441 12023 17994
## [337] 13916 16410 16565 16320 12827 17091 13267 13768 16325 19023 15302 12060
## [349] 14305 12459 18179 13195 17870 15976 16520 18302 18335 13623 16441 18269
## [361] 17022 13006 13765 14484 14447 15473 13602 13295 16691 14171 16763 14896
## [373] 16069 14935 17907 17392 14655 18646 15305 14938 17468 16309 17317 14128
## [385] 12116 16067 15109 18355 15846 17102 15096 13250 16010 17804 14135 17122
## [397] 16623 18784 20880 15631 14651 16476 17090 15102 17942 12906 16394 17677
## [409] 16992 16159 13886 14584 13273 17251 14846 19441 19273 15601 17059 14031
## [421] 18489 16898 16416 12837 17724 18619 17777 18410 20217 19638 19793 17910
## [433] 13874 19649 15244 18973 15168 15342 15902 20235 16308 18144 13781 16143
## [445] 16423 17094 16805 17397 16366 19949 18386 14221 15200 15914 15964 14213
## [457] 13901 16724 17753 20464 19178 17165 14493 16356 13799 15897 18900 17545
## [469] 17453 19094 16250 16221 19653 15583 15554 12053 16809 14449 15528 19815
## [481] 16429 14365 13395 15186 22043 16284 14493 18330 17166 13897 14964 13845
## [493] 17985 15972 12497 17727 17700 19455 18906 16246 16432 13215 15851 13728
## [505] 15141 16959 14614 15846 16524 19564 16290 14736 13683 16544 13950 12038
## [517] 14167 14745 14684 22288 13923 13304 17168 14327 16617 13485 18693 18309
## [529] 21092 18765 15695 17839 16069 17004 15202 17962 11419 13581 13832 18636
## [541] 15287 14403 14938 13200 18151 15987 13813 13082 17604 12438 13804 17828
## [553] 14750 18052 16309 14572 16119 14425 14810 15762 15013 16431 18049 18073
## [565] 15592 17573 12767 14809 15992 12718 12877 17513 18069 16897 12864 16550
## [577] 17954 16206 15210 19638 14513 16350 17258 16108 10177 15815 17941 14723
## [589] 13750 16466 14644 13762 16243 17989 14963 14946 15127 16805 17869 14355
## [601] 16299 15375 13481 16104 16409 18774 18351 13015 18247 12953 12855 15081
## [613] 17688 13216 13707 17480 13142 14784 19292 16798 13925 15539 16933 13907
## [625] 14966 15103 14801 15841 17459 14743 15253 15679 16010 19086 18254 19146
## [637] 15789 14839 16702 19677 17547 15264 16484 16782 16867 15988 18406 14645
## [649] 16708 15859

Describir ingresos

summary(ingresos)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   10177   14521   15991   15962   17378   22288

Agrupar datos

La función fdt() determina la tabla de clases de los datos.

Los argumentos de la función fdt() son: x es el conjunto de datos vector de ingresos, start significa un valor numérico en donde inician los datos, end es un valor numérico en donde termina los datos y h es el valor numérico de la amplitud de cada clase.

tabla <- fdt(x = ingresos, start = 10000, end = 23000, h = 1000)
tabla
##   Class limits   f   rf rf(%)  cf  cf(%)
##  [10000,11000)   3 0.00  0.46   3   0.46
##  [11000,12000)   7 0.01  1.08  10   1.54
##  [12000,13000)  39 0.06  6.00  49   7.54
##  [13000,14000)  72 0.11 11.08 121  18.62
##  [14000,15000)  90 0.14 13.85 211  32.46
##  [15000,16000) 115 0.18 17.69 326  50.15
##  [16000,17000) 133 0.20 20.46 459  70.62
##  [17000,18000)  87 0.13 13.38 546  84.00
##  [18000,19000)  56 0.09  8.62 602  92.62
##  [19000,20000)  34 0.05  5.23 636  97.85
##  [20000,21000)   9 0.01  1.38 645  99.23
##  [21000,22000)   3 0.00  0.46 648  99.69
##  [22000,23000)   2 0.00  0.31 650 100.00

Estructura de tabla

Se observan las 13 registros, siendo estos las clases de los datos agrupados.

str(tabla)
## List of 2
##  $ table :'data.frame':  13 obs. of  6 variables:
##   ..$ Class limits: Factor w/ 13 levels "[10000,11000)",..: 1 2 3 4 5 6 7 8 9 10 ...
##   ..$ f           : int [1:13] 3 7 39 72 90 115 133 87 56 34 ...
##   ..$ rf          : num [1:13] 0.00462 0.01077 0.06 0.11077 0.13846 ...
##   ..$ rf(%)       : num [1:13] 0.462 1.077 6 11.077 13.846 ...
##   ..$ cf          : num [1:13] 3 10 49 121 211 326 459 546 602 636 ...
##   ..$ cf(%)       : num [1:13] 0.462 1.538 7.538 18.615 32.462 ...
##  $ breaks: Named num [1:4] 10000 23000 1000 0
##   ..- attr(*, "names")= chr [1:4] "start" "end" "h" "right"
##  - attr(*, "class")= chr [1:3] "fdt.default" "fdt" "list"

Valores mínimos y máximos

minimo <- min(ingresos)
maximo <- max(ingresos)
minimo
## [1] 10177
maximo
## [1] 22288

Histograma de ingresos

La función histogram() del paquete lattice refleja el hisgrograma, los argumentos ~ significa que los datos están en función de la variable ingresos, breaks significa el número de columna o cortes y type = ‘count’ identifica la frecuencia en el eje de las y. El valor de 13 se elige al azar, que se consolida con el número de clases que existen en la tabla de frecuencias contenida en la variable llamada tabla.

histogram(~ ingresos, breaks = 13, type = "count")

La mayoría de los datos se concentran entre \(16000\) y \(17000\).

Rango de los datos

El rango presenta los valores mínimos y máximos

range(ingresos)
## [1] 10177 22288

Clases de los datos agrupados

Se confirman las 13 clases

clases <- tabla$table$`Class limits`
clases
##  [1] [10000,11000) [11000,12000) [12000,13000) [13000,14000) [14000,15000)
##  [6] [15000,16000) [16000,17000) [17000,18000) [18000,19000) [19000,20000)
## [11] [20000,21000) [21000,22000) [22000,23000)
## 13 Levels: [10000,11000) [11000,12000) [12000,13000) ... [22000,23000)

Límites de clase

La variable clase es de tipo factor o categórico.

Con funciones adecuadas se realiza una extracción de caracteres substring() y conversión de datos as.character() y as.numeric() se extraen los límites inferiores y superiores de cada clase.

li <- as.numeric(substring(as.character(clases), 2,6))
ls <- as.numeric(substring(as.character(clases), 8,12))
li
##  [1] 10000 11000 12000 13000 14000 15000 16000 17000 18000 19000 20000 21000
## [13] 22000
ls
##  [1] 11000 12000 13000 14000 15000 16000 17000 18000 19000 20000 21000 22000
## [13] 23000

Intervalo de clase

El intervalo de clase pues es la diferencia entre límite superior e inferior de cada clase.

intervalo <- ls-li
intervalo
##  [1] 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000

Interpretación

Se crea una tabla de frecuencia de los datos ingresos, se visualiza un histograma de los ingresos, así como se crean los estadísticos mínimo, máximo, rango, clases, e intervalo de clase.

Para este caso se trabajó con la variable del salió en pesos mexicanos que percibe un conjunto de trabajadores.

Con la función set.seed (2021) nos arroja un resultado cuyo salario mínimo que obtiene un trabajador fue de 10177 y el salario máximo fue de 22288. La media fue de 159991.

El histograma de datos de ingresos nos refleja un resultado que va, que la mayoría de los datos se concentran entre 16000 y 17000.

Se generaron \(13\) clases a partir de la muestra de los datos.

El valor mínimo de los datos es 1.0177^{4} y el valor máximo de los datos es 2.2288^{4}.

La mayoría de los datos de los ingresos se concentran entre \(16000\) y \(17000\).

Se obtuvo un intervalo de clase de 1000.