1 Objetivo

Determinar medidas de dispersión de datos como edades, sueldos y calificaciones.

2 Descripción

  • Simular muestra de varios conjuntos de datos

  • Se identifica media de los datos

  • Se muestran tablas de frecuencias

  • Se calculan medidas de dispersión, varianza y desviación estándar.

  • Se visualiza la dispersión de los datos en relación a la media.

  • Se calcula el coeficiente de variación y se compara con similares conjuntos de datos.

3 Marco teórico

¿Para que sirven las medidas de dispersión?

El reporte de una medida de centralización como la media, mediana y moda sólo da información parcial sobre un conjunto o distribución de datos. Diferentes muestras o poblaciones pueden tener medidas idénticas de centro y aun así diferir una de otra en otras importantes maneras. [@devore2016a].

La imagen siguiente muestra tres conjuntos de datos y los tres tienen media y mediana igual, sin embargo la dispersión es diferentes, es decir cual conjunto de datos se aleja mas de la media.

La primera tiene la cantidad más grande de variabilidad, la tercera tiene la cantidad más pequeña y la segunda es intermedia respecto a las otras dos en este aspecto. [@devore2016].

3.1 Varianza

La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está basada en la diferencia entre el valor de cada observación (\(x_i\)) y la media \(\bar{x}\) [@anderson2008].

3.1.1 Fórmulas

Se identifican las fórmulas para varianza poblacional y muestral, dependiendo de los datos a analizar, si es todas las observaciones de la población y solo una muestra de la misma.

Para efectos de este ejercicio se utiliza mas específicamente la varianza y desviación muestral.

3.1.1.1 Fórmula de varianza poblacional

\[ \sigma^2 = \frac{\sum_{i=1}^N(x_i- \mu)^2}{N} \]

siendo \(\mu\) la media poblacional y \(N\) el total de los datos de la población.

3.1.1.2 Fórmula de varianza muestral

\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]

siendo \(\bar{x}\) la media muestral y \(n\) el total de los datos de la muestra.

Las unidades al cuadrado de la varianza dificultan la comprensión e interpretación intuitiva de los valores numéricos de la varianza.

3.2 Desviación estándar

La desviación estándar se define como la raíz cuadrada positiva de la varianza.

Continuando con la notación adoptada para la varianza muestral y para la varianza poblacional, se emplea \(\varsigma\) para denotar la desviación estándar muestral y \(\sigma\) para denotar la desviación estándar poblacional.

¿Qué se gana con convertir la varianza en la correspondiente desviación estándar?.

Como la desviación estándar es la raíz cuadrada de la varianza, las unidades de la varianza, son al cuadrado, posiblemente dificulta su interpretación, por tanto, la desviación estándar de se interpreta de mejor manera la variabilidad de los datos porque el valor resultante se mide en las mismas unidades que los datos originales. [@anderson2008].

Una interpretación preliminar de la desviación estándar muestral es que es el tamaño de una desviación típica o representativa de la media muestral dentro de la muestra dada.[@devore2016]

3.2.1 Fórmula de desviación estándar poblacional

\[ \sigma = \sqrt{\sigma^2} \]

3.2.2 Fórmula de desviación estándar muestral

\[ S = \sqrt{S^2} \]

3.3 Coeficiente de variación (CV)

En algunas ocasiones se requiere un estadístico descriptivo que indique cuán grande es la desviación estándar en relación con la media. Existe el coeficiente de variación y resuelve ese propósito.

La fórmula del coeficiente de variación indica el grado de dispersión de un conjunto de datos con respecto a la media.

\[ CV = \left(\frac{\sigma}{\bar{x}} \times 100 \right) \text{%} \]

4 Desarrollo

4.1 Librerías

Instalar librerías anticipadamente con install.packages(“fdth”)

library(fdth)    # Para tablas de frecuencias
library(ggplot2) # Para gráficos

4.2 Datos edades

Se establece valor de semilla para que se generen los mismos datos.

set.seed(2022)

Se generan 200 edades en dos conjuntos de datos diferentes.

edades1 se genera con función de aleatoriedad sample()

edades2 se genera con la función de distribución normal rnorm().

n <- 300
edades1 <- sample(x = 18:60,size = n,replace = TRUE )

4.2.1 edades1

4.2.1.1 Mostrar los datos edades1

Se identifican los datos edades1

edades1
##   [1] 53 31 28 21 23 31 45 58 31 24 46 39 22 18 49 18 51 56 46 29 32 23 56 39 22
##  [26] 28 45 60 37 25 20 21 46 19 51 25 59 56 50 48 36 18 36 58 58 20 49 27 50 52
##  [51] 43 37 43 33 40 48 22 33 59 19 41 41 34 29 32 35 22 23 50 59 40 57 57 43 46
##  [76] 32 50 48 29 40 28 26 52 52 37 52 49 55 33 19 25 34 45 33 32 50 46 25 34 26
## [101] 56 19 36 46 20 21 53 55 22 18 37 43 30 43 39 51 18 33 59 21 30 20 59 18 45
## [126] 49 24 21 58 30 22 59 48 40 32 59 36 18 31 28 57 55 28 35 19 28 31 52 20 58
## [151] 22 23 22 35 37 43 51 36 54 36 20 31 20 34 36 18 44 31 49 25 49 56 32 19 55
## [176] 55 26 59 48 40 28 47 35 27 44 32 21 30 38 44 37 33 23 50 53 57 31 34 47 58
## [201] 30 55 27 45 33 33 52 54 43 27 20 19 18 40 46 31 48 33 45 46 60 52 54 53 59
## [226] 31 35 24 37 59 50 25 56 27 59 48 42 56 26 25 23 18 56 35 49 49 41 23 42 33
## [251] 56 25 20 38 33 56 59 56 60 45 48 48 38 25 31 54 30 33 21 19 57 37 18 43 34
## [276] 20 19 47 33 41 60 52 35 60 38 58 28 58 34 59 39 57 26 48 26 36 26 33 45 52

4.2.1.2 Tablas de frecuencias edades1

Se muestran las tablas de frecuencias del conjunto de datos edades1.

En las tablas de frecuencias se determina matemáticamente el número de clases, La opción matemáticamente más consistente es la conocida como regla de Sturges.

La solución de esta ecuación proporciona una regla práctica para obtener el número de clases.

\[ k=1+3.322*log10(n) \]

  • Siendo k el número de clases

  • log es la función logarítmica de base 10, log10()

  • y n el total de la muestra

El rango de clase de acuerdo a Sturges está dada por \[ h=\frac{max(datos) - min(datos)}{k} \]Siendo h el rango de cada clase y max(datos) - min(datos) el rango del total de los datos, es decir la diferencia entre límite superior menos límite inferior.

Existen otras formas de determinar el número de clases a utilizar, algunas más complejas, otras más simples.

Independientemente de la forma de cálculo seleccionada ya se Sturges, Scott o Freedman-Diaconis (FD), lo realmente importante es que la información mostrada en la tabla de frecuencia sea fácil de revisar, que no contenga un número excesivo de clases y que la información que en ella se refleja permita comprender cómo se presentan los datos en la población o de una muestra.

El número de clase de acuerdo par \(n=200\) de acuerdo a Sturges es:

k  <- round(1+3.322 * log10(n))
k
## [1] 9

La amplitud h1 y h2 para cada conjunto de datos es igual a:

h = diff(range(edades1)) / k
h
## [1] 4.666667
tabla.edades1 <- fdt(x = edades1, breaks="Sturges")
tabla.edades1
##   Class limits  f   rf rf(%)  cf  cf(%)
##   [17.82,22.1) 45 0.15 15.00  45  15.00
##   [22.1,26.38) 26 0.09  8.67  71  23.67
##  [26.38,30.65) 22 0.07  7.33  93  31.00
##  [30.65,34.93) 39 0.13 13.00 132  44.00
##  [34.93,39.21) 31 0.10 10.33 163  54.33
##  [39.21,43.49) 20 0.07  6.67 183  61.00
##  [43.49,47.77) 22 0.07  7.33 205  68.33
##  [47.77,52.04) 38 0.13 12.67 243  81.00
##  [52.04,56.32) 25 0.08  8.33 268  89.33
##   [56.32,60.6) 32 0.11 10.67 300 100.00
  • Class limits significa el rango de cada clase

  • f significa la frecuencia, la suma de f debe ser el total de elementos.

  • rf significa frecuencia relativa la suma de todas las rf debe ser el 1

  • rf% significa el valor relativo pero en porcentaje, la suma de rf% debe ser el 100%

  • cf significa frecuencia acumulada

  • cf% significa frecuencia porcentual acumulada

4.2.1.3 Histograma de edades1

hist(edades1, breaks = "Sturges" ) 

4.2.1.4 Dispersión de edades1

datos.edades1 <- data.frame(x = 1:length(edades1), edad= edades1)
ggplot(datos.edades1, aes(x=x, y=edad))+
  geom_point() +
  geom_hline(yintercept = mean(edades1), col='red') +
  ggtitle(label = "Dispersión de edades1", subtitle = paste("media = ", mean(edades1)))

4.2.2 edades2

4.2.2.1 Crear y mostrrar los datos edades2

edades2 <- round(rnorm(n = n, mean = 30, sd = 5))

Se identifican los datos edades2

sort(edades2)
##   [1] 18 18 18 18 18 19 19 20 20 20 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22
##  [26] 23 23 23 23 23 23 23 23 23 23 23 23 24 24 24 24 24 24 24 25 25 25 25 25 25
##  [51] 25 25 25 25 25 25 25 25 26 26 26 26 26 26 26 26 26 26 26 26 26 27 27 27 27
##  [76] 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 28 28 28 28 28 28 28
## [101] 28 28 28 28 28 28 28 28 28 28 28 28 28 28 29 29 29 29 29 29 29 29 29 29 29
## [126] 29 29 29 29 29 29 29 29 29 29 29 29 29 30 30 30 30 30 30 30 30 30 30 30 30
## [151] 30 30 30 30 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 32
## [176] 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32
## [201] 32 32 32 32 32 32 32 32 32 32 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33
## [226] 33 33 33 33 33 33 33 34 34 34 34 34 34 34 34 34 34 34 34 34 35 35 35 35 35
## [251] 35 35 35 35 35 35 35 35 35 35 35 35 35 35 36 36 36 36 36 36 36 36 36 36 36
## [276] 36 36 36 37 37 37 37 38 38 38 39 39 39 39 39 39 40 40 40 40 42 42 43 43 44

4.2.2.2 Tablas de frecuencias edades2

Se muestran las tablas de frecuencias del conjunto de datos edades2.

4.2.2.3 Histograma de edades2

hist(edades2, breaks = "Sturges" ) 

4.2.2.4 Dispersión de edades2

datos.edades2 <- data.frame(x = 1:length(edades2), edad= edades2)
ggplot(datos.edades2, aes(x=x, y=edad))+
  geom_point() +
  geom_hline(yintercept = mean(edades2), col='red') +
  ggtitle(label = "Dispersión de edades2", subtitle = paste("media = ", mean(edades2)))

4.3 Medidas de dispersión

Las medidas de dispersión varianza y desviación estándar miden el valor de dispersión de un conjunto de datos numéricos.

La dispersión significa que tanto los datos están alejados de la media, el valor de la desviación se compara con la media y se interpreta que tanto los valores distan del valor de la media.

4.3.1 Medias aritméticas de edades

media_edades1 <- mean(edades1)
media_edades2 <- mean(edades2)
media_edades1; media_edades2 
## [1] 38.44667
## [1] 29.92667

4.3.2 Varianza y desviación estándar

\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]

\[ S = \sqrt{S^{2}} \]

tabla.varianza.edades1 <- data.frame(x = edades1,
  x_media = media_edades1,
  xi.menos.media = edades1 - media_edades1,
  xi.menos.media.cuad = (edades1 - media_edades1)^2)
tabla.varianza.edades1
##      x  x_media xi.menos.media xi.menos.media.cuad
## 1   53 38.44667     14.5533333         211.7995111
## 2   31 38.44667     -7.4466667          55.4528444
## 3   28 38.44667    -10.4466667         109.1328444
## 4   21 38.44667    -17.4466667         304.3861778
## 5   23 38.44667    -15.4466667         238.5995111
## 6   31 38.44667     -7.4466667          55.4528444
## 7   45 38.44667      6.5533333          42.9461778
## 8   58 38.44667     19.5533333         382.3328444
## 9   31 38.44667     -7.4466667          55.4528444
## 10  24 38.44667    -14.4466667         208.7061778
## 11  46 38.44667      7.5533333          57.0528444
## 12  39 38.44667      0.5533333           0.3061778
## 13  22 38.44667    -16.4466667         270.4928444
## 14  18 38.44667    -20.4466667         418.0661778
## 15  49 38.44667     10.5533333         111.3728444
## 16  18 38.44667    -20.4466667         418.0661778
## 17  51 38.44667     12.5533333         157.5861778
## 18  56 38.44667     17.5533333         308.1195111
## 19  46 38.44667      7.5533333          57.0528444
## 20  29 38.44667     -9.4466667          89.2395111
## 21  32 38.44667     -6.4466667          41.5595111
## 22  23 38.44667    -15.4466667         238.5995111
## 23  56 38.44667     17.5533333         308.1195111
## 24  39 38.44667      0.5533333           0.3061778
## 25  22 38.44667    -16.4466667         270.4928444
## 26  28 38.44667    -10.4466667         109.1328444
## 27  45 38.44667      6.5533333          42.9461778
## 28  60 38.44667     21.5533333         464.5461778
## 29  37 38.44667     -1.4466667           2.0928444
## 30  25 38.44667    -13.4466667         180.8128444
## 31  20 38.44667    -18.4466667         340.2795111
## 32  21 38.44667    -17.4466667         304.3861778
## 33  46 38.44667      7.5533333          57.0528444
## 34  19 38.44667    -19.4466667         378.1728444
## 35  51 38.44667     12.5533333         157.5861778
## 36  25 38.44667    -13.4466667         180.8128444
## 37  59 38.44667     20.5533333         422.4395111
## 38  56 38.44667     17.5533333         308.1195111
## 39  50 38.44667     11.5533333         133.4795111
## 40  48 38.44667      9.5533333          91.2661778
## 41  36 38.44667     -2.4466667           5.9861778
## 42  18 38.44667    -20.4466667         418.0661778
## 43  36 38.44667     -2.4466667           5.9861778
## 44  58 38.44667     19.5533333         382.3328444
## 45  58 38.44667     19.5533333         382.3328444
## 46  20 38.44667    -18.4466667         340.2795111
## 47  49 38.44667     10.5533333         111.3728444
## 48  27 38.44667    -11.4466667         131.0261778
## 49  50 38.44667     11.5533333         133.4795111
## 50  52 38.44667     13.5533333         183.6928444
## 51  43 38.44667      4.5533333          20.7328444
## 52  37 38.44667     -1.4466667           2.0928444
## 53  43 38.44667      4.5533333          20.7328444
## 54  33 38.44667     -5.4466667          29.6661778
## 55  40 38.44667      1.5533333           2.4128444
## 56  48 38.44667      9.5533333          91.2661778
## 57  22 38.44667    -16.4466667         270.4928444
## 58  33 38.44667     -5.4466667          29.6661778
## 59  59 38.44667     20.5533333         422.4395111
## 60  19 38.44667    -19.4466667         378.1728444
## 61  41 38.44667      2.5533333           6.5195111
## 62  41 38.44667      2.5533333           6.5195111
## 63  34 38.44667     -4.4466667          19.7728444
## 64  29 38.44667     -9.4466667          89.2395111
## 65  32 38.44667     -6.4466667          41.5595111
## 66  35 38.44667     -3.4466667          11.8795111
## 67  22 38.44667    -16.4466667         270.4928444
## 68  23 38.44667    -15.4466667         238.5995111
## 69  50 38.44667     11.5533333         133.4795111
## 70  59 38.44667     20.5533333         422.4395111
## 71  40 38.44667      1.5533333           2.4128444
## 72  57 38.44667     18.5533333         344.2261778
## 73  57 38.44667     18.5533333         344.2261778
## 74  43 38.44667      4.5533333          20.7328444
## 75  46 38.44667      7.5533333          57.0528444
## 76  32 38.44667     -6.4466667          41.5595111
## 77  50 38.44667     11.5533333         133.4795111
## 78  48 38.44667      9.5533333          91.2661778
## 79  29 38.44667     -9.4466667          89.2395111
## 80  40 38.44667      1.5533333           2.4128444
## 81  28 38.44667    -10.4466667         109.1328444
## 82  26 38.44667    -12.4466667         154.9195111
## 83  52 38.44667     13.5533333         183.6928444
## 84  52 38.44667     13.5533333         183.6928444
## 85  37 38.44667     -1.4466667           2.0928444
## 86  52 38.44667     13.5533333         183.6928444
## 87  49 38.44667     10.5533333         111.3728444
## 88  55 38.44667     16.5533333         274.0128444
## 89  33 38.44667     -5.4466667          29.6661778
## 90  19 38.44667    -19.4466667         378.1728444
## 91  25 38.44667    -13.4466667         180.8128444
## 92  34 38.44667     -4.4466667          19.7728444
## 93  45 38.44667      6.5533333          42.9461778
## 94  33 38.44667     -5.4466667          29.6661778
## 95  32 38.44667     -6.4466667          41.5595111
## 96  50 38.44667     11.5533333         133.4795111
## 97  46 38.44667      7.5533333          57.0528444
## 98  25 38.44667    -13.4466667         180.8128444
## 99  34 38.44667     -4.4466667          19.7728444
## 100 26 38.44667    -12.4466667         154.9195111
## 101 56 38.44667     17.5533333         308.1195111
## 102 19 38.44667    -19.4466667         378.1728444
## 103 36 38.44667     -2.4466667           5.9861778
## 104 46 38.44667      7.5533333          57.0528444
## 105 20 38.44667    -18.4466667         340.2795111
## 106 21 38.44667    -17.4466667         304.3861778
## 107 53 38.44667     14.5533333         211.7995111
## 108 55 38.44667     16.5533333         274.0128444
## 109 22 38.44667    -16.4466667         270.4928444
## 110 18 38.44667    -20.4466667         418.0661778
## 111 37 38.44667     -1.4466667           2.0928444
## 112 43 38.44667      4.5533333          20.7328444
## 113 30 38.44667     -8.4466667          71.3461778
## 114 43 38.44667      4.5533333          20.7328444
## 115 39 38.44667      0.5533333           0.3061778
## 116 51 38.44667     12.5533333         157.5861778
## 117 18 38.44667    -20.4466667         418.0661778
## 118 33 38.44667     -5.4466667          29.6661778
## 119 59 38.44667     20.5533333         422.4395111
## 120 21 38.44667    -17.4466667         304.3861778
## 121 30 38.44667     -8.4466667          71.3461778
## 122 20 38.44667    -18.4466667         340.2795111
## 123 59 38.44667     20.5533333         422.4395111
## 124 18 38.44667    -20.4466667         418.0661778
## 125 45 38.44667      6.5533333          42.9461778
## 126 49 38.44667     10.5533333         111.3728444
## 127 24 38.44667    -14.4466667         208.7061778
## 128 21 38.44667    -17.4466667         304.3861778
## 129 58 38.44667     19.5533333         382.3328444
## 130 30 38.44667     -8.4466667          71.3461778
## 131 22 38.44667    -16.4466667         270.4928444
## 132 59 38.44667     20.5533333         422.4395111
## 133 48 38.44667      9.5533333          91.2661778
## 134 40 38.44667      1.5533333           2.4128444
## 135 32 38.44667     -6.4466667          41.5595111
## 136 59 38.44667     20.5533333         422.4395111
## 137 36 38.44667     -2.4466667           5.9861778
## 138 18 38.44667    -20.4466667         418.0661778
## 139 31 38.44667     -7.4466667          55.4528444
## 140 28 38.44667    -10.4466667         109.1328444
## 141 57 38.44667     18.5533333         344.2261778
## 142 55 38.44667     16.5533333         274.0128444
## 143 28 38.44667    -10.4466667         109.1328444
## 144 35 38.44667     -3.4466667          11.8795111
## 145 19 38.44667    -19.4466667         378.1728444
## 146 28 38.44667    -10.4466667         109.1328444
## 147 31 38.44667     -7.4466667          55.4528444
## 148 52 38.44667     13.5533333         183.6928444
## 149 20 38.44667    -18.4466667         340.2795111
## 150 58 38.44667     19.5533333         382.3328444
## 151 22 38.44667    -16.4466667         270.4928444
## 152 23 38.44667    -15.4466667         238.5995111
## 153 22 38.44667    -16.4466667         270.4928444
## 154 35 38.44667     -3.4466667          11.8795111
## 155 37 38.44667     -1.4466667           2.0928444
## 156 43 38.44667      4.5533333          20.7328444
## 157 51 38.44667     12.5533333         157.5861778
## 158 36 38.44667     -2.4466667           5.9861778
## 159 54 38.44667     15.5533333         241.9061778
## 160 36 38.44667     -2.4466667           5.9861778
## 161 20 38.44667    -18.4466667         340.2795111
## 162 31 38.44667     -7.4466667          55.4528444
## 163 20 38.44667    -18.4466667         340.2795111
## 164 34 38.44667     -4.4466667          19.7728444
## 165 36 38.44667     -2.4466667           5.9861778
## 166 18 38.44667    -20.4466667         418.0661778
## 167 44 38.44667      5.5533333          30.8395111
## 168 31 38.44667     -7.4466667          55.4528444
## 169 49 38.44667     10.5533333         111.3728444
## 170 25 38.44667    -13.4466667         180.8128444
## 171 49 38.44667     10.5533333         111.3728444
## 172 56 38.44667     17.5533333         308.1195111
## 173 32 38.44667     -6.4466667          41.5595111
## 174 19 38.44667    -19.4466667         378.1728444
## 175 55 38.44667     16.5533333         274.0128444
## 176 55 38.44667     16.5533333         274.0128444
## 177 26 38.44667    -12.4466667         154.9195111
## 178 59 38.44667     20.5533333         422.4395111
## 179 48 38.44667      9.5533333          91.2661778
## 180 40 38.44667      1.5533333           2.4128444
## 181 28 38.44667    -10.4466667         109.1328444
## 182 47 38.44667      8.5533333          73.1595111
## 183 35 38.44667     -3.4466667          11.8795111
## 184 27 38.44667    -11.4466667         131.0261778
## 185 44 38.44667      5.5533333          30.8395111
## 186 32 38.44667     -6.4466667          41.5595111
## 187 21 38.44667    -17.4466667         304.3861778
## 188 30 38.44667     -8.4466667          71.3461778
## 189 38 38.44667     -0.4466667           0.1995111
## 190 44 38.44667      5.5533333          30.8395111
## 191 37 38.44667     -1.4466667           2.0928444
## 192 33 38.44667     -5.4466667          29.6661778
## 193 23 38.44667    -15.4466667         238.5995111
## 194 50 38.44667     11.5533333         133.4795111
## 195 53 38.44667     14.5533333         211.7995111
## 196 57 38.44667     18.5533333         344.2261778
## 197 31 38.44667     -7.4466667          55.4528444
## 198 34 38.44667     -4.4466667          19.7728444
## 199 47 38.44667      8.5533333          73.1595111
## 200 58 38.44667     19.5533333         382.3328444
## 201 30 38.44667     -8.4466667          71.3461778
## 202 55 38.44667     16.5533333         274.0128444
## 203 27 38.44667    -11.4466667         131.0261778
## 204 45 38.44667      6.5533333          42.9461778
## 205 33 38.44667     -5.4466667          29.6661778
## 206 33 38.44667     -5.4466667          29.6661778
## 207 52 38.44667     13.5533333         183.6928444
## 208 54 38.44667     15.5533333         241.9061778
## 209 43 38.44667      4.5533333          20.7328444
## 210 27 38.44667    -11.4466667         131.0261778
## 211 20 38.44667    -18.4466667         340.2795111
## 212 19 38.44667    -19.4466667         378.1728444
## 213 18 38.44667    -20.4466667         418.0661778
## 214 40 38.44667      1.5533333           2.4128444
## 215 46 38.44667      7.5533333          57.0528444
## 216 31 38.44667     -7.4466667          55.4528444
## 217 48 38.44667      9.5533333          91.2661778
## 218 33 38.44667     -5.4466667          29.6661778
## 219 45 38.44667      6.5533333          42.9461778
## 220 46 38.44667      7.5533333          57.0528444
## 221 60 38.44667     21.5533333         464.5461778
## 222 52 38.44667     13.5533333         183.6928444
## 223 54 38.44667     15.5533333         241.9061778
## 224 53 38.44667     14.5533333         211.7995111
## 225 59 38.44667     20.5533333         422.4395111
## 226 31 38.44667     -7.4466667          55.4528444
## 227 35 38.44667     -3.4466667          11.8795111
## 228 24 38.44667    -14.4466667         208.7061778
## 229 37 38.44667     -1.4466667           2.0928444
## 230 59 38.44667     20.5533333         422.4395111
## 231 50 38.44667     11.5533333         133.4795111
## 232 25 38.44667    -13.4466667         180.8128444
## 233 56 38.44667     17.5533333         308.1195111
## 234 27 38.44667    -11.4466667         131.0261778
## 235 59 38.44667     20.5533333         422.4395111
## 236 48 38.44667      9.5533333          91.2661778
## 237 42 38.44667      3.5533333          12.6261778
## 238 56 38.44667     17.5533333         308.1195111
## 239 26 38.44667    -12.4466667         154.9195111
## 240 25 38.44667    -13.4466667         180.8128444
## 241 23 38.44667    -15.4466667         238.5995111
## 242 18 38.44667    -20.4466667         418.0661778
## 243 56 38.44667     17.5533333         308.1195111
## 244 35 38.44667     -3.4466667          11.8795111
## 245 49 38.44667     10.5533333         111.3728444
## 246 49 38.44667     10.5533333         111.3728444
## 247 41 38.44667      2.5533333           6.5195111
## 248 23 38.44667    -15.4466667         238.5995111
## 249 42 38.44667      3.5533333          12.6261778
## 250 33 38.44667     -5.4466667          29.6661778
## 251 56 38.44667     17.5533333         308.1195111
## 252 25 38.44667    -13.4466667         180.8128444
## 253 20 38.44667    -18.4466667         340.2795111
## 254 38 38.44667     -0.4466667           0.1995111
## 255 33 38.44667     -5.4466667          29.6661778
## 256 56 38.44667     17.5533333         308.1195111
## 257 59 38.44667     20.5533333         422.4395111
## 258 56 38.44667     17.5533333         308.1195111
## 259 60 38.44667     21.5533333         464.5461778
## 260 45 38.44667      6.5533333          42.9461778
## 261 48 38.44667      9.5533333          91.2661778
## 262 48 38.44667      9.5533333          91.2661778
## 263 38 38.44667     -0.4466667           0.1995111
## 264 25 38.44667    -13.4466667         180.8128444
## 265 31 38.44667     -7.4466667          55.4528444
## 266 54 38.44667     15.5533333         241.9061778
## 267 30 38.44667     -8.4466667          71.3461778
## 268 33 38.44667     -5.4466667          29.6661778
## 269 21 38.44667    -17.4466667         304.3861778
## 270 19 38.44667    -19.4466667         378.1728444
## 271 57 38.44667     18.5533333         344.2261778
## 272 37 38.44667     -1.4466667           2.0928444
## 273 18 38.44667    -20.4466667         418.0661778
## 274 43 38.44667      4.5533333          20.7328444
## 275 34 38.44667     -4.4466667          19.7728444
## 276 20 38.44667    -18.4466667         340.2795111
## 277 19 38.44667    -19.4466667         378.1728444
## 278 47 38.44667      8.5533333          73.1595111
## 279 33 38.44667     -5.4466667          29.6661778
## 280 41 38.44667      2.5533333           6.5195111
## 281 60 38.44667     21.5533333         464.5461778
## 282 52 38.44667     13.5533333         183.6928444
## 283 35 38.44667     -3.4466667          11.8795111
## 284 60 38.44667     21.5533333         464.5461778
## 285 38 38.44667     -0.4466667           0.1995111
## 286 58 38.44667     19.5533333         382.3328444
## 287 28 38.44667    -10.4466667         109.1328444
## 288 58 38.44667     19.5533333         382.3328444
## 289 34 38.44667     -4.4466667          19.7728444
## 290 59 38.44667     20.5533333         422.4395111
## 291 39 38.44667      0.5533333           0.3061778
## 292 57 38.44667     18.5533333         344.2261778
## 293 26 38.44667    -12.4466667         154.9195111
## 294 48 38.44667      9.5533333          91.2661778
## 295 26 38.44667    -12.4466667         154.9195111
## 296 36 38.44667     -2.4466667           5.9861778
## 297 26 38.44667    -12.4466667         154.9195111
## 298 33 38.44667     -5.4466667          29.6661778
## 299 45 38.44667      6.5533333          42.9461778
## 300 52 38.44667     13.5533333         183.6928444

Calculando la suma y determinando varianza

n <- length(edades1)
suma <- sum(tabla.varianza.edades1$xi.menos.media.cuad)
suma
## [1] 50688.15
varianza <- suma / (n -1)
varianza
## [1] 169.5256

Con las funciones de var() y sd() se determinan la varianza y a desviación respectivamente y con mean() la media de la muestra.

varianza_edades1 <- var(edades1)
varianza_edades2 <- var(edades2)
desv.std_edades1 <- sd(edades1)
desv.std_edades2 <- sd(edades2)

Se muestran los valores generados, el punto y coma en R significa en una misma linea se ejecutan dos instrucciones o dos comandos, en este caso solo mostrar los valores.

varianza_edades1; varianza_edades2
## [1] 169.5256
## [1] 25.82738
desv.std_edades1; desv.std_edades2 
## [1] 13.0202
## [1] 5.082065

4.3.3 Coeficiente de variación

El coeficiente de variación (CV) es un estadístico que permite comparar entre dos o mas conjuntos de datos cuál es estos tiene una dispersión mayor o menor.

Al identificar el CV de un conjunto de datos y compararlo con otro CV de otro conjunto de datos similares, se puede determinar cual de los datos tiene mayor o menor dispersión y se puede concluir en cual es estos está mas dispersos sus datos, es decir cuál de ellos se aleja mas o menos de la media, según sea el caso.

Para determinar el coeficiente de variación se establece la división de la desviación estándar entre la media del conjunto de datos.

\[ CV = \frac{\sigma}{\bar{x}} \]

CV_edades1 <- desv.std_edades1 / media_edades1
CV_edades1
## [1] 0.3386561
CV_edades2 <- desv.std_edades2 / media_edades2
CV_edades2
## [1] 0.1698173

5 Interpretación

¿Qué representan las tablas de frecuencias para los datos edades?

Las tablas de frecuencia representan las clases y la frecuencias de casos de cada una de las clases, permiten observar los valores relativos y porcentuales de las frecuencias.

Con respecto a edades1 existe un 15.5% de valores que están en un rango o intervalo entre 36.83 y 41.59.

En relación a edades2 existe una cantidad de valores entre 36.83 y 46.34 que representan el 14.5%.

¿Cuáles son los valores media y desviación de los conjuntos de datos edades?

Con respecto a los valores estadísticos del conjunto de datos edades1, el valor la media es de: 38.4466667, la desviación es de: 13.0201987.

Con respecto a los valores estadísticos del conjunto de datos edades2, el valor la media es de: 29.9266667, la desviación es de: 5.0820646.

¿Cuáles son los valores de coeficiente de variación para los conjuntos de datos edades y que representan?

El coeficiente de variación de edades1 es de: 0.3386561y el CV de edades2 es de: 0.1698173

Existe mayor dispersión en los valores del conjunto de datos edades1 con respecto a edades2 por tener ligeramente mayor valor en su coeficiente de variación.

EXPLICACION CASO.

La anterior presentacion del caso muestra a traves de funciones y graficas la dispersion de datos o alejamiento en una cierta cantidad de datos comprendida como edades.

Esto se grafica en puntos que represntan los datos y que tan alejados y dispersos estan de la media.