Crear tablas de contingencia y determinar medidas de dispersión de datos para los conjuntos edades, sueldos y calificaciones.
Identificar media de los datos
Identificar medidas de dispersión, varianza y desviación estándar.
Generar tablas de contingencia
Visualizar dispersión de los datos.
Identificar coeficiente de variación y comparar con similares conjuntos de datos.
Instalar librerías de forma anticipada con install.packages(“fdth”). A continuación se instancia la librería.
library(fdth)
Se establece valor de semilla para que los valores resultantes de la selección al azar, sean los mismos.
set.seed(2021)
Se generan 200 edades en dos conjuntos diferentes, con valores de entre 18 y 60 años, con la posibilidad de repetirse. Ambos conjuntos son diferentes entre sí únicamente por los valores que se obtienen a través de la selección aleatoria.
edades1=sample(x=18:60, size=200, replace=TRUE)
edades2=sample(x=18:60, size=200, replace=TRUE)
Se muestran los datos de los dos conjuntos, ordenados de forma ascendente mediante la función sort(), la cual toma cada elemento del conjunto de datos y los ordena de menor a mayor.
sort(edades1)
## [1] 18 18 18 18 18 18 18 19 19 20 20 20 20 20 21 21 21 21 22 22 22 22 22 23 23
## [26] 23 23 23 23 24 24 24 24 24 25 25 25 25 25 26 26 26 26 26 26 26 27 27 27 28
## [51] 28 28 28 28 28 29 29 29 30 30 30 30 30 30 30 31 32 32 32 32 32 33 33 33 33
## [76] 34 34 35 35 35 35 36 36 36 36 36 36 36 36 36 36 36 37 37 37 37 38 38 38 38
## [101] 39 39 39 39 39 39 39 39 39 39 39 40 40 40 40 40 40 41 41 41 41 41 41 42 43
## [126] 43 44 44 44 45 45 46 46 46 46 46 46 46 46 47 47 47 47 48 48 48 48 48 48 49
## [151] 49 50 51 51 51 51 52 52 53 53 53 53 54 54 54 54 54 54 54 54 55 55 55 55 55
## [176] 55 55 55 55 56 56 56 56 56 57 57 57 58 58 58 58 59 60 60 60 60 60 60 60 60
sort(edades2)
## [1] 18 18 18 18 18 19 20 20 20 20 21 21 21 21 21 21 22 22 22 22 23 23 23 23 23
## [26] 23 23 23 23 24 24 24 24 24 25 25 25 25 25 26 26 26 26 26 26 26 26 27 27 27
## [51] 27 28 28 28 29 29 30 30 30 30 30 31 31 31 32 32 32 33 33 33 33 33 34 34 34
## [76] 34 34 34 34 35 35 35 36 36 36 37 37 37 37 37 37 37 37 37 38 38 39 39 39 39
## [101] 40 40 40 40 40 40 41 41 41 41 42 42 42 42 42 42 42 42 43 43 43 43 43 43 43
## [126] 43 43 44 44 44 44 44 45 45 45 45 46 46 46 47 47 47 47 47 47 48 48 48 48 49
## [151] 49 50 50 50 50 51 51 51 51 51 52 52 52 52 53 53 53 54 54 54 54 55 55 55 55
## [176] 56 57 57 57 57 57 57 58 58 58 58 58 59 59 59 59 59 59 59 60 60 60 60 60 60
También llamada tabla de contingencia, es una herramienta cuyo objetivo es representar en resumen la relación entre diferentes variables y medir la interacción entre ambas.
Se muestran las tablas de frecuencia del conjunto de datos edades 1 y 2.
En las tablas de frecuencias se determina matemáticamente el número de clases, La opción matemáticamente más consistente es la conocida como regla de Sturges.
\[ k=1+3.322log10(N) \]
Siendo k el número de clases
log es la función logarítmica de base 10, log10()
y N el total de la muestra
El rango de clase de acuerdo a Sturges está dada por
\[ h=\frac{max(datos) - min(datos)}{k} \]
Siendo h el rango de cada clase y max(datos) - min(datos) el rango del total de los datos, es decir la diferencia entre límite superior menos límite inferior.
Independientemente de la forma de cálculo seleccionada ya se *Sturges*, *Scott* o Freedman-Diaconis (FD), lo realmente importante es que la información mostrada en la tabla de frecuencia sea fácil de visualizar y analizar; que no contenga un número excesivo de clases y que la información que en ella se refleja permita comprender cómo se presentan los datos de una población o de una muestra.
tabla.edades1<-fdt(x=edades1)
tabla.edades1
## Class limits f rf rf(%) cf cf(%)
## [17.82,22.57) 23 0.12 11.5 23 11.5
## [22.57,27.33) 26 0.13 13.0 49 24.5
## [27.33,32.08) 22 0.11 11.0 71 35.5
## [32.08,36.83) 21 0.10 10.5 92 46.0
## [36.83,41.59) 31 0.16 15.5 123 61.5
## [41.59,46.34) 16 0.08 8.0 139 69.5
## [46.34,51.09) 17 0.09 8.5 156 78.0
## [51.09,55.85) 23 0.12 11.5 179 89.5
## [55.85,60.6) 21 0.10 10.5 200 100.0
Class limits representa el rango de cada clase.
f significa la frecuencia. La suma de f debe dar el total de elementos.
rf es la frecuencia relativa, y la suma de de rf debe ser igual a 1.
rf% significa el valor relativo pero en porcentaje. La suma de rf% debe ser 100%.
cf es la frecuencia acumulada.
cf% representa la frecuencia porcentual acumulada.
Se presenta a continuación el histograma del comportamiento de los datos de Edades 1, así mismo se emplea la función plot() para crear la tabla de dispersión del conjunto de datos analizado; la cual pide en primer lugar un argumento del eje x de una gráfica, para esto se requiere un vector, en este caso edades1.
hist(edades1, main="Edades 1 - Histograma", xlab="Rango de edad", ylab="Frecuencia")
plot(edades1, main="Edades 1 - Gráfica de dispersión", xlab="Rango de edad", ylab="Frecuencia")
Se visualizan los mismos elementos ahora con el vector Edades2
tabla.edades2<-fdt(x=edades2)
tabla.edades2
## Class limits f rf rf(%) cf cf(%)
## [17.82,22.57) 20 0.10 10.0 20 10.0
## [22.57,27.33) 31 0.16 15.5 51 25.5
## [27.33,32.08) 16 0.08 8.0 67 33.5
## [32.08,36.83) 18 0.09 9.0 85 42.5
## [36.83,41.59) 25 0.12 12.5 110 55.0
## [41.59,46.34) 29 0.14 14.5 139 69.5
## [46.34,51.09) 21 0.10 10.5 160 80.0
## [51.09,55.85) 15 0.07 7.5 175 87.5
## [55.85,60.6) 25 0.12 12.5 200 100.0
hist(edades2, main="Edades 2 - Histograma", xlab="Rango de edad", ylab="Frecuencia")
plot(edades2, main="Edades 2 - Gráfica de dispersión", xlab="Rango de edad", ylab="Frecuencia")
Las medidas de dispersión varianza y desviación estándar miden el valor de dispersión de un conjunto de datos numéricos. Por dispersión se entiende la acción de separación hacia diferentes direcciones de los elementos de un conjunto, qué tanto se alejan los datos de la media. El valor de la desviación se compara con la media y se interpreta qué tanto los valores distan del valor de la media.
La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones. La desviación también se utiliza para cuantificar la dispersión de un conjunto de datos numéricos. Con las funciones de var() y sd() se determinan la varianza y a desviación respectivamente y con mean() la media aritmética de la muestra.
media_edades1 <- mean(edades1)
media_edades2 <- mean(edades2)
varianza_edades1 <- var(edades1)
varianza_edades2 <- var(edades2)
desv.std_edades1 <- sd(edades1)
desv.std_edades2 <- sd(edades2)
Se muestran los valores generados, el punto y coma en R significa en una misma linea se ejecutan dos instrucciones o dos comandos, en este caso solo mostrar los valores.
media_edades1; media_edades2
## [1] 38.61
## [1] 38.945
varianza_edades1; varianza_edades2
## [1] 156.7919
## [1] 154.2633
desv.std_edades1; desv.std_edades2
## [1] 12.52166
## [1] 12.42028
El coeficiente de variación (CV) es un estadístico que permite comparar entre dos o mas conjuntos de datos cuál es estos tiene una dispersión mayor o menor.
Al identificar el CV de un conjunto de datos y compararlo con otro CV de otro conjunto de datos similares, se puede determinar cual de los datos tiene mayor o menor dispersión y se puede concluir en cual es estos está mas dispersos sus datos, es decir cuál de ellos se aleja mas o menos de la media, según sea el caso.
Para determinar el coeficiente de variación se establece la división de la desviación estándar entre la media del conjunto de datos.
\[ CV = \frac{\sigma}{\bar{x}} \]
CV_edades1 <- desv.std_edades1 / media_edades1
CV_edades1
## [1] 0.3243112
CV_edades2 <- desv.std_edades2 / media_edades2
CV_edades2
## [1] 0.3189184
Se generan 200 sueldos en dos conjuntos de datos diferentes, de entre $10,000 y $12,000.
sueldos1 <- sample(x = 10000:12000,size = 200,replace = TRUE )
sueldos2 <- sample(x = 10000:12000,size = 200,replace = TRUE )
Ordenados a través de la función sort().
sort(sueldos1)
## [1] 10007 10009 10011 10015 10023 10032 10040 10046 10054 10069 10076 10106
## [13] 10112 10117 10117 10122 10128 10133 10159 10184 10197 10204 10229 10236
## [25] 10240 10250 10257 10259 10277 10304 10306 10312 10343 10349 10359 10361
## [37] 10399 10431 10444 10448 10450 10464 10470 10471 10483 10490 10502 10512
## [49] 10521 10530 10576 10580 10598 10599 10606 10610 10630 10631 10650 10650
## [61] 10659 10666 10668 10669 10672 10713 10715 10725 10737 10757 10763 10772
## [73] 10783 10808 10813 10830 10854 10861 10880 10906 10907 10908 10918 10932
## [85] 10935 10961 11006 11019 11024 11035 11040 11057 11074 11082 11095 11135
## [97] 11137 11140 11172 11175 11196 11200 11200 11205 11214 11220 11225 11234
## [109] 11249 11256 11263 11269 11277 11287 11290 11293 11295 11296 11308 11323
## [121] 11335 11339 11346 11348 11351 11358 11368 11379 11379 11387 11389 11396
## [133] 11402 11411 11424 11427 11445 11474 11477 11495 11499 11502 11504 11517
## [145] 11521 11529 11532 11532 11538 11546 11550 11551 11555 11558 11559 11566
## [157] 11566 11573 11576 11599 11612 11613 11623 11641 11641 11644 11654 11673
## [169] 11679 11679 11709 11715 11722 11734 11760 11764 11781 11786 11792 11796
## [181] 11826 11829 11845 11846 11850 11859 11863 11868 11868 11884 11892 11897
## [193] 11910 11913 11933 11958 11975 11986 11989 11995
sort(sueldos2)
## [1] 10011 10017 10022 10026 10033 10035 10042 10045 10051 10052 10069 10072
## [13] 10079 10104 10105 10114 10146 10151 10165 10170 10186 10194 10197 10198
## [25] 10217 10242 10298 10304 10310 10356 10362 10366 10405 10423 10430 10431
## [37] 10443 10448 10449 10456 10464 10467 10469 10483 10485 10487 10496 10527
## [49] 10528 10534 10558 10564 10567 10571 10580 10592 10598 10643 10650 10667
## [61] 10670 10690 10697 10700 10713 10713 10733 10763 10764 10764 10765 10813
## [73] 10830 10851 10860 10887 10888 10897 10901 10923 10926 10937 10940 10940
## [85] 10950 10966 10977 10977 10987 10996 11013 11015 11021 11023 11039 11040
## [97] 11052 11052 11064 11071 11077 11089 11110 11113 11120 11128 11159 11160
## [109] 11166 11175 11204 11208 11217 11228 11236 11247 11263 11264 11270 11282
## [121] 11292 11298 11301 11325 11325 11325 11326 11332 11340 11353 11359 11362
## [133] 11379 11386 11386 11394 11402 11408 11414 11432 11437 11466 11467 11467
## [145] 11472 11487 11505 11507 11524 11527 11545 11563 11572 11587 11596 11603
## [157] 11616 11622 11648 11649 11651 11663 11664 11681 11682 11687 11697 11705
## [169] 11706 11710 11721 11731 11747 11751 11765 11768 11786 11792 11792 11798
## [181] 11807 11821 11834 11836 11838 11845 11860 11864 11864 11875 11886 11919
## [193] 11928 11931 11937 11943 11951 11956 11965 11968
Se muestran las tablas de frecuencias del conjunto de datos sueldos1 y sueldos2.
tabla.sueldos1 <- fdt(x = sueldos1, breaks = "Sturges")
tabla.sueldos1
## Class limits f rf rf(%) cf cf(%)
## [9906.93,10152.266) 18 0.09 9.0 18 9.0
## [10152.266,10397.601) 18 0.09 9.0 36 18.0
## [10397.601,10642.937) 22 0.11 11.0 58 29.0
## [10642.937,10888.272) 21 0.10 10.5 79 39.5
## [10888.272,11133.608) 16 0.08 8.0 95 47.5
## [11133.608,11378.943) 32 0.16 16.0 127 63.5
## [11378.943,11624.279) 36 0.18 18.0 163 81.5
## [11624.279,11869.614) 26 0.13 13.0 189 94.5
## [11869.614,12114.95) 11 0.06 5.5 200 100.0
Histograma y gráfica de dispersión
hist(sueldos1, main="Sueldos 1 - Histograma", xlab="Rango de sueldos", ylab="Frecuencia")
plot(sueldos1, main="Sueldos 1 - Gráfica de Dispersión", xlab="Rango de sueldos", ylab="Frecuencia")
tabla.sueldos2 <- fdt(x = sueldos2, breaks = "Sturges")
tabla.sueldos2
## Class limits f rf rf(%) cf cf(%)
## [9910.89,10152.756) 18 0.09 9.0 18 9.0
## [10152.756,10394.621) 14 0.07 7.0 32 16.0
## [10394.621,10636.487) 25 0.12 12.5 57 28.5
## [10636.487,10878.352) 18 0.09 9.0 75 37.5
## [10878.352,11120.218) 30 0.15 15.0 105 52.5
## [11120.218,11362.083) 27 0.14 13.5 132 66.0
## [11362.083,11603.949) 24 0.12 12.0 156 78.0
## [11603.949,11845.814) 30 0.15 15.0 186 93.0
## [11845.814,12087.68) 14 0.07 7.0 200 100.0
hist(sueldos2, main="Sueldos 2 - Histograma", xlab="Rango de sueldos", ylab="Frecuencia")
plot(sueldos2, main="Sueldos 2 - Gráfica de Dispersión", xlab="Rango de sueldos", ylab="Frecuencia")
media_sueldos1 <- mean(sueldos1)
media_sueldos2 <- mean(sueldos2)
varianza_sueldos1 <- var(sueldos1)
varianza_sueldos2 <- var(sueldos2)
desv.std_sueldos1 <- sd(sueldos1)
desv.std_sueldos2 <- sd(sueldos2)
Se muestran los valores de cada conjunto generado, la media, la varianza y desviación estándar.
media_sueldos1; media_sueldos2
## [1] 11053.49
## [1] 11045.01
varianza_sueldos1; varianza_sueldos2
## [1] 342913.3
## [1] 335765.6
desv.std_sueldos1; desv.std_sueldos2
## [1] 585.588
## [1] 579.4529
CV_sueldos1 <- desv.std_sueldos1 / media_sueldos1
CV_sueldos1
## [1] 0.05297766
CV_sueldos2 <- desv.std_sueldos2 / media_sueldos2
CV_sueldos2
## [1] 0.05246287
Se generan 500 calificaciones en dos conjuntos de datos diferentes, entre un rango de 70 a 100, con la posibilidad de repetir valores entre ellos.
calif1 <- sample(x = 70:100,size = 500,replace = TRUE )
calif2 <- sample(x = 70:100,size = 500,replace = TRUE )
Se visualizan los datos ordenados con la función sort().
sort(calif1)
## [1] 70 70 70 70 70 70 70 70 70 70 71 71 71 71 71 71 71 71
## [19] 71 71 72 72 72 72 72 72 72 72 72 72 72 72 72 72 72 72
## [37] 72 72 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73
## [55] 73 73 73 73 74 74 74 74 74 74 74 74 74 74 74 74 74 74
## [73] 74 74 74 74 74 74 75 75 75 75 75 75 75 75 75 75 75 76
## [91] 76 76 76 76 76 76 76 76 76 76 76 76 76 76 76 77 77 77
## [109] 77 77 77 77 77 77 77 77 77 77 78 78 78 78 78 78 78 78
## [127] 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 79
## [145] 79 79 79 79 79 79 79 79 80 80 80 80 80 80 80 80 80 80
## [163] 80 80 80 80 80 80 80 80 80 80 80 80 80 80 81 81 81 81
## [181] 81 81 81 81 81 81 82 82 82 82 82 82 82 82 82 82 82 82
## [199] 83 83 83 83 83 83 83 83 83 83 83 83 83 83 84 84 84 84
## [217] 84 84 84 84 84 84 84 84 84 84 84 84 84 85 85 85 85 85
## [235] 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 86 86 86
## [253] 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86
## [271] 86 87 87 87 87 87 87 87 87 87 87 87 87 87 87 87 87 88
## [289] 88 88 88 88 88 88 88 88 88 88 88 88 88 89 89 89 89 89
## [307] 89 89 89 89 89 89 89 89 89 89 89 89 89 89 89 89 90 90
## [325] 90 90 90 90 90 90 91 91 91 91 91 91 91 91 91 91 91 91
## [343] 91 92 92 92 92 92 92 92 92 92 92 92 92 92 92 92 92 92
## [361] 92 92 93 93 93 93 93 93 93 93 93 93 93 93 93 93 93 93
## [379] 93 93 93 93 94 94 94 94 94 94 94 94 94 94 94 94 95 95
## [397] 95 95 95 95 95 95 95 95 95 95 95 95 95 95 95 95 95 96
## [415] 96 96 96 96 96 96 96 96 96 96 96 96 97 97 97 97 97 97
## [433] 97 97 97 97 97 97 97 97 97 97 97 97 97 97 97 97 97 97
## [451] 97 97 97 97 97 98 98 98 98 98 98 98 98 98 98 98 98 98
## [469] 98 98 98 99 99 99 99 99 99 99 99 99 99 99 99 99 99 100
## [487] 100 100 100 100 100 100 100 100 100 100 100 100 100 100
sort(calif2)
## [1] 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70
## [19] 71 71 71 71 71 71 71 71 71 71 71 71 71 71 71 71 71 71
## [37] 71 72 72 72 72 72 72 72 72 72 72 72 72 72 72 72 72 72
## [55] 72 72 72 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73
## [73] 73 73 74 74 74 74 74 74 74 74 74 74 74 75 75 75 75 75
## [91] 75 75 75 75 75 75 75 75 75 75 75 75 75 76 76 76 76 76
## [109] 76 76 76 76 76 76 76 76 76 77 77 77 77 77 77 77 77 77
## [127] 77 77 77 77 77 77 77 77 77 78 78 78 78 78 78 78 78 78
## [145] 78 78 78 78 78 78 78 78 78 78 79 79 79 79 79 79 79 79
## [163] 79 79 79 79 80 80 80 80 80 80 80 80 80 80 80 80 80 80
## [181] 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81
## [199] 81 81 81 81 81 81 82 82 82 82 82 82 82 82 82 82 82 82
## [217] 82 82 82 83 83 83 83 83 83 83 83 83 83 83 83 83 83 83
## [235] 84 84 84 84 84 84 84 84 84 84 84 84 84 84 84 85 85 85
## [253] 85 85 85 85 85 85 85 85 85 85 85 85 85 86 86 86 86 86
## [271] 86 86 86 86 86 86 86 87 87 87 87 87 87 87 87 87 87 87
## [289] 87 87 87 87 87 88 88 88 88 88 88 88 88 88 88 88 88 88
## [307] 89 89 89 89 89 89 89 89 89 89 89 89 89 89 89 90 90 90
## [325] 90 90 90 90 90 90 90 90 90 90 90 90 90 91 91 91 91 91
## [343] 91 91 91 91 91 91 91 91 91 91 91 91 92 92 92 92 92 92
## [361] 92 92 92 92 92 92 92 92 92 92 93 93 93 93 93 93 93 93
## [379] 93 93 93 93 94 94 94 94 94 94 94 94 94 94 94 94 94 94
## [397] 94 94 94 94 94 94 94 94 94 94 94 94 94 95 95 95 95 95
## [415] 95 95 95 95 95 95 95 95 95 95 96 96 96 96 96 96 96 96
## [433] 96 96 96 96 96 96 96 96 96 97 97 97 97 97 97 97 97 97
## [451] 97 97 98 98 98 98 98 98 98 98 98 98 98 98 98 98 98 99
## [469] 99 99 99 99 99 99 99 99 99 99 99 99 99 100 100 100 100 100
## [487] 100 100 100 100 100 100 100 100 100 100 100 100 100 100
Se muestran las tablas de frecuencias del conjunto de datos calif1 y calif2.
tabla.calif1 <- fdt(x = calif1, breaks = "Sturges")
tabla.calif1
## Class limits f rf rf(%) cf cf(%)
## [69.3,72.5) 38 0.08 7.6 38 7.6
## [72.5,75.6) 51 0.10 10.2 89 17.8
## [75.6,78.8) 54 0.11 10.8 143 28.6
## [78.8,82) 43 0.09 8.6 186 37.2
## [82,85.2) 63 0.13 12.6 249 49.8
## [85.2,88.3) 52 0.10 10.4 301 60.2
## [88.3,91.5) 42 0.08 8.4 343 68.6
## [91.5,94.7) 51 0.10 10.2 394 78.8
## [94.7,97.8) 61 0.12 12.2 455 91.0
## [97.8,101) 45 0.09 9.0 500 100.0
hist(calif1, main="Calificaciones 1 - Histograma", xlab="Rango de Calificaciones", ylab="Frecuencia")
plot(calif1, main="Calificaciones 1 - Gráfica de Dispersión", xlab="Rango de Calificaciones", ylab="Frecuencia")
tabla.calif2 <- fdt(x = calif2, breaks = "Sturges")
tabla.calif2
## Class limits f rf rf(%) cf cf(%)
## [69.3,72.5) 57 0.11 11.4 57 11.4
## [72.5,75.6) 46 0.09 9.2 103 20.6
## [75.6,78.8) 51 0.10 10.2 154 30.8
## [78.8,82) 50 0.10 10.0 204 40.8
## [82,85.2) 61 0.12 12.2 265 53.0
## [85.2,88.3) 41 0.08 8.2 306 61.2
## [88.3,91.5) 48 0.10 9.6 354 70.8
## [91.5,94.7) 55 0.11 11.0 409 81.8
## [94.7,97.8) 43 0.09 8.6 452 90.4
## [97.8,101) 48 0.10 9.6 500 100.0
hist(calif2, main="Calificaciones 2 - Histograma", xlab="Rango de Calificaciones", ylab="Frecuencia")
plot(calif2, main="Calificaciones 2 - Gráfica de Dispersión", xlab="Rango de Calificaciones", ylab="Frecuencia")
media_calif1 <- mean(calif1)
media_calif2 <- mean(calif2)
varianza_calif1 <- var(calif1)
varianza_calif2 <- var(calif2)
desv.std_calif1 <- sd(calif1)
desv.std_calif2 <- sd(calif2)
Se muestran los valores generados.
media_calif1; media_calif2
## [1] 85.394
## [1] 84.778
varianza_calif1; varianza_calif2
## [1] 78.28333
## [1] 82.52577
desv.std_calif1; desv.std_calif2
## [1] 8.847787
## [1] 9.084369
CV_calif1 <- desv.std_calif1 / media_calif1
CV_calif1
## [1] 0.1036113
CV_calif2 <- desv.std_calif2 / media_calif2
CV_calif2
## [1] 0.1071548
Las tablas de contingencia representan las clases y la frecuencias de casos de cada una de las clases, permiten observar los valores relativos y porcentuales de las frecuencias.
Con respecto a edades1, donde la media corresponde a 38.61, existe un 15.5% de valores que están en un rango o intervalo entre 36.83 y 41.59.
En relación a edades2, cuya moda es 38.945, existe una cantidad de valores entre 36.83 y 46.34 que representan el 14.5%.
Con respecto a los valores estadísticos del conjunto de datos edades1, el valor la media es de: 38.61, la desviación es de: 12.5216556.
Con respecto a los valores estadísticos del conjunto de datos edades2, el valor la media es de: 38.945, la desviación es de: 12.4202774.
El coeficiente de variación de edades1 es de: 0.3243112y el CV de edades2 es de: 0.3189184
Existe mayor dispersión en los valores del conjunto de datos edades1 con respecto a edades2 por tener ligeramente mayor valor en su coeficiente de variación.
Con respecto a sueldos1, donde la media corresponde a 11053.49, existe un 8% de valores que están en un rango o intervalo entre 10888.272 y 11133.608.
En relación a sueldos2, cuya media es 11045.01, existe una cantidad de valores entre 10878.352 y 11120.218 que representan el 15%.
Con respecto a los valores estadísticos del conjunto de datos sueldos1, el valor la media es de: 11053.49, la desviación es de: 585.5880263.
Con respecto a los valores estadísticos del conjunto de datos edades2, el valor la media es de: 11045.01, la desviación es de: 579.4528782.
El coeficiente de variación de sueldos1 es de: 0.0529777y el CV de edades2 es de: 0.0524629
Existe mayor dispersión en los valores del conjunto de datos sueldos1 con respecto a sueldos2 por tener ligeramente mayor valor en su coeficiente de variación.
Con respecto a calif1, donde la media corresponde a 85.394, existe un 10.4% de valores que están en un rango o intervalo entre 85.2 y 88.3.
En relación a calif2, cuya media es 84.778, existe una cantidad de valores entre 82 y 85.2 que representan el 12.2%.
Con respecto a los valores estadísticos del conjunto de datos calif1, el valor la media es de: 85.394, la desviación es de: 8.8477868.
Con respecto a los valores estadísticos del conjunto de datos calif2, el valor la media es de: 84.778, la desviación es de: 9.0843694.
El coeficiente de variación de calif1 es de: 0.1036113y el CV de calif2 es de: 0.1071548
Existe menor dispersión en los valores del conjunto de datos calif1 con respecto a calif2 por tener ligeramente menor valor en su coeficiente de variación.