1 Objetivo

Determinar medidas de dispersión de datos como edades, sueldos y calificaciones.

2 Descripción

  • Simular muestra de varios conjuntos de datos

  • Se identifica media de los datos

  • Se muestran tablas de frecuencias

  • Se calculan medidas de dispersión, varianza y desviación estándar.

  • Se visualiza la dispersión de los datos en relación a la media.

  • Se calcula el coeficiente de variación y se compara con similares conjuntos de datos.

3 Marco teórico

¿Para que sirven las medidas de dispersión?

El reporte de una medida de centralización como la media, mediana y moda sólo da información parcial sobre un conjunto o distribución de datos. Diferentes muestras o poblaciones pueden tener medidas idénticas de centro y aun así diferir una de otra en otras importantes maneras. [@devore2016a].

La imagen siguiente muestra tres conjuntos de datos y los tres tienen media y mediana igual, sin embargo la dispersión es diferentes, es decir cual conjunto de datos se aleja mas de la media.

La primera tiene la cantidad más grande de variabilidad, la tercera tiene la cantidad más pequeña y la segunda es intermedia respecto a las otras dos en este aspecto. [@devore2016].

3.1 Varianza

La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está basada en la diferencia entre el valor de cada observación (\(x_i\)) y la media \(\bar{x}\) [@anderson2008].

3.1.1 Fórmulas

Se identifican las fórmulas para varianza poblacional y muestral, dependiendo de los datos a analizar, si es todas las observaciones de la población y solo una muestra de la misma.

Para efectos de este ejercicio se utiliza mas específicamente la varianza y desviación muestral.

3.1.1.1 Fórmula de varianza poblacional

\[ \sigma^2 = \frac{\sum_{i=1}^N(x_i- \mu)^2}{N} \]

siendo \(\mu\) la media poblacional y \(N\) el total de los datos de la población.

3.1.1.2 Fórmula de varianza muestral

\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]

siendo \(\bar{x}\) la media muestral y \(n\) el total de los datos de la muestra.

Las unidades al cuadrado de la varianza dificultan la comprensión e interpretación intuitiva de los valores numéricos de la varianza.

3.2 Desviación estándar

La desviación estándar se define como la raíz cuadrada positiva de la varianza.

Continuando con la notación adoptada para la varianza muestral y para la varianza poblacional, se emplea \(\varsigma\) para denotar la desviación estándar muestral y \(\sigma\) para denotar la desviación estándar poblacional.

¿Qué se gana con convertir la varianza en la correspondiente desviación estándar?.

Como la desviación estándar es la raíz cuadrada de la varianza, las unidades de la varianza, son al cuadrado, posiblemente dificulta su interpretación, por tanto, la desviación estándar de se interpreta de mejor manera la variabilidad de los datos porque el valor resultante se mide en las mismas unidades que los datos originales. [@anderson2008].

Una interpretación preliminar de la desviación estándar muestral es que es el tamaño de una desviación típica o representativa de la media muestral dentro de la muestra dada.[@devore2016]

3.2.1 Fórmula de desviación estándar poblacional

\[ \sigma = \sqrt{\sigma^2} \]

3.2.2 Fórmula de desviación estándar muestral

\[ S = \sqrt{S^2} \]

3.3 Coeficiente de variación (CV)

En algunas ocasiones se requiere un estadístico descriptivo que indique cuán grande es la desviación estándar en relación con la media. Existe el coeficiente de variación y resuelve ese propósito.

La fórmula del coeficiente de variación indica el grado de dispersión de un conjunto de datos con respecto a la media.

\[ CV = \left(\frac{\sigma}{\bar{x}} \times 100 \right) \text{%} \]

4 Desarrollo

4.1 Librerías

Instalar librerías anticipadamente con install.packages(“fdth”)

library(fdth)    # Para tablas de frecuencias
library(ggplot2) # Para gráficos

4.2 Datos edades

Se establece valor de semilla para que se generen los mismos datos.

set.seed(400)

Se generan 400 edades en dos conjuntos de datos diferentes.

edades1 se genera con función de aleatoriedad sample()

edades2 se genera con la función de distribución normal rnorm().

n <- 400
edades1 <- sample(x = 18:60,size = n,replace = TRUE )

4.2.1 edades1

4.2.1.1 Mostrar los datos edades1

Se identifican los datos edades1

edades1
##   [1] 54 40 40 45 39 45 31 30 31 24 58 44 57 53 55 59 38 45 35 53 18 22 52 37 48
##  [26] 38 37 44 27 45 35 40 21 55 18 28 26 26 31 37 39 37 43 25 53 58 50 58 24 20
##  [51] 45 46 29 24 30 37 46 56 19 20 38 19 47 29 21 58 24 54 57 56 46 32 24 54 21
##  [76] 23 47 19 59 60 45 39 55 26 20 55 27 36 59 57 52 33 21 23 43 21 54 33 35 19
## [101] 44 28 60 43 35 25 52 57 24 44 30 40 37 39 25 30 33 27 33 53 31 29 33 22 60
## [126] 44 19 60 19 57 46 43 36 22 23 19 59 41 58 33 18 33 38 43 44 24 34 46 32 53
## [151] 57 24 58 50 34 34 55 43 37 48 57 30 31 39 40 47 59 57 41 30 33 42 31 25 43
## [176] 20 44 47 30 31 48 30 35 19 37 29 34 35 60 57 18 51 57 44 38 35 34 34 34 53
## [201] 28 26 57 37 56 42 43 54 42 34 57 52 48 38 20 28 34 31 25 19 35 38 44 43 57
## [226] 34 43 21 28 25 57 39 22 51 27 37 45 52 53 53 47 29 47 59 38 47 54 20 49 28
## [251] 40 45 35 50 59 29 51 27 49 42 49 49 25 33 40 48 43 41 42 25 50 41 18 54 35
## [276] 51 40 29 27 42 44 46 37 26 41 47 35 28 33 48 33 37 53 49 54 54 53 49 44 38
## [301] 22 39 55 43 38 26 48 31 18 53 44 60 31 39 59 40 36 21 26 59 25 33 32 27 60
## [326] 22 19 25 33 58 54 40 46 36 46 51 50 29 26 54 42 40 34 21 24 50 33 46 25 59
## [351] 53 32 31 26 18 54 30 22 21 20 19 58 58 25 48 45 48 31 60 24 38 40 49 38 58
## [376] 42 58 56 40 51 43 41 59 35 18 48 31 43 23 43 30 60 59 36 37 39 34 19 56 23

4.2.1.2 Tablas de frecuencias edades1

Se muestran las tablas de frecuencias del conjunto de datos edades1.

En las tablas de frecuencias se determina matemáticamente el número de clases, La opción matemáticamente más consistente es la conocida como regla de Sturges.

La solución de esta ecuación proporciona una regla práctica para obtener el número de clases.

\[ k=1+3.322*log10(n) \]

  • Siendo k el número de clases

  • log es la función logarítmica de base 10, log10()

  • y n el total de la muestra

El rango de clase de acuerdo a Sturges está dada por \[ h=\frac{max(datos) - min(datos)}{k} \]Siendo h el rango de cada clase y max(datos) - min(datos) el rango del total de los datos, es decir la diferencia entre límite superior menos límite inferior.

Existen otras formas de determinar el número de clases a utilizar, algunas más complejas, otras más simples.

Independientemente de la forma de cálculo seleccionada ya se Sturges, Scott o Freedman-Diaconis (FD), lo realmente importante es que la información mostrada en la tabla de frecuencia sea fácil de revisar, que no contenga un número excesivo de clases y que la información que en ella se refleja permita comprender cómo se presentan los datos en la población o de una muestra.

El número de clase de acuerdo par \(n=400\) de acuerdo a Sturges es:

k  <- round(1+3.322 * log10(n))
k
## [1] 10

La amplitud h1 y h2 para cada conjunto de datos es igual a:

h = diff(range(edades1)) / k
h
## [1] 4.2
tabla.edades1 <- fdt(x = edades1, breaks="Sturges")
tabla.edades1
##   Class limits  f   rf rf(%)  cf  cf(%)
##   [17.82,22.1) 43 0.11 10.75  43  10.75
##   [22.1,26.38) 36 0.09  9.00  79  19.75
##  [26.38,30.65) 32 0.08  8.00 111  27.75
##  [30.65,34.93) 43 0.11 10.75 154  38.50
##  [34.93,39.21) 51 0.13 12.75 205  51.25
##  [39.21,43.49) 42 0.10 10.50 247  61.75
##  [43.49,47.77) 38 0.10  9.50 285  71.25
##  [47.77,52.04) 34 0.09  8.50 319  79.75
##  [52.04,56.32) 35 0.09  8.75 354  88.50
##   [56.32,60.6) 46 0.12 11.50 400 100.00
  • Class limits significa el rango de cada clase

  • f significa la frecuencia, la suma de f debe ser el total de elementos.

  • rf significa frecuencia relativa la suma de todas las rf debe ser el 1

  • rf% significa el valor relativo pero en porcentaje, la suma de rf% debe ser el 100%

  • cf significa frecuencia acumulada

  • cf% significa frecuencia porcentual acumulada

4.2.1.3 Histograma de edades1

hist(edades1, breaks = "Sturges" ) 

4.2.1.4 Dispersión de edades1

datos.edades1 <- data.frame(x = 1:length(edades1), edad= edades1)
ggplot(datos.edades1, aes(x=x, y=edad))+
  geom_point() +
  geom_hline(yintercept = mean(edades1), col='red') +
  ggtitle(label = "Dispersión de edades1", subtitle = paste("media = ", mean(edades1)))

4.2.2 edades2

4.2.2.1 Crear y mostrrar los datos edades2

edades2 <- round(rnorm(n = n, mean = 30, sd = 5))

Se identifican los datos edades2

sort(edades2)
##   [1] 15 16 16 17 17 18 19 19 20 20 20 20 20 20 21 21 21 21 21 21 22 22 22 22 22
##  [26] 22 22 22 22 22 22 23 23 23 23 23 23 23 23 23 23 23 23 23 24 24 24 24 24 24
##  [51] 24 24 24 24 24 24 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 26
##  [76] 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 27
## [101] 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27
## [126] 27 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28
## [151] 28 28 28 28 28 28 28 28 28 28 28 29 29 29 29 29 29 29 29 29 29 29 29 29 29
## [176] 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 30 30 30 30
## [201] 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 31 31
## [226] 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31
## [251] 31 31 31 31 31 31 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32
## [276] 32 32 32 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33
## [301] 33 33 33 33 33 33 33 33 33 33 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34
## [326] 34 34 34 34 34 34 34 34 35 35 35 35 35 35 35 35 35 35 35 35 35 35 35 35 36
## [351] 36 36 36 36 36 36 36 36 36 36 37 37 37 37 37 37 37 37 37 37 37 37 37 37 37
## [376] 37 38 38 38 38 38 38 38 38 38 38 39 39 39 39 40 40 40 40 40 41 42 42 45 46

4.2.2.2 Tablas de frecuencias edades2

Se muestran las tablas de frecuencias del conjunto de datos edades2.

4.2.2.3 Histograma de edades2

hist(edades2, breaks = "Sturges" ) 

4.2.2.4 Dispersión de edades2

datos.edades2 <- data.frame(x = 1:length(edades2), edad= edades2)
ggplot(datos.edades2, aes(x=x, y=edad))+
  geom_point() +
  geom_hline(yintercept = mean(edades2), col='red') +
  ggtitle(label = "Dispersión de edades2", subtitle = paste("media = ", mean(edades2)))

4.3 Medidas de dispersión

Las medidas de dispersión varianza y desviación estándar miden el valor de dispersión de un conjunto de datos numéricos.

La dispersión significa que tanto los datos están alejados de la media, el valor de la desviación se compara con la media y se interpreta que tanto los valores distan del valor de la media.

4.3.1 Medias aritméticas de edades

media_edades1 <- mean(edades1)
media_edades2 <- mean(edades2)
media_edades1; media_edades2 
## [1] 39.2175
## [1] 29.7775

4.3.2 Varianza y desviación estándar

\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]

\[ S = \sqrt{S^{2}} \]

tabla.varianza.edades1 <- data.frame(x = edades1,
  x_media = media_edades1,
  xi.menos.media = edades1 - media_edades1,
  xi.menos.media.cuad = (edades1 - media_edades1)^2)
tabla.varianza.edades1
##      x x_media xi.menos.media xi.menos.media.cuad
## 1   54 39.2175        14.7825        218.52230625
## 2   40 39.2175         0.7825          0.61230625
## 3   40 39.2175         0.7825          0.61230625
## 4   45 39.2175         5.7825         33.43730625
## 5   39 39.2175        -0.2175          0.04730625
## 6   45 39.2175         5.7825         33.43730625
## 7   31 39.2175        -8.2175         67.52730625
## 8   30 39.2175        -9.2175         84.96230625
## 9   31 39.2175        -8.2175         67.52730625
## 10  24 39.2175       -15.2175        231.57230625
## 11  58 39.2175        18.7825        352.78230625
## 12  44 39.2175         4.7825         22.87230625
## 13  57 39.2175        17.7825        316.21730625
## 14  53 39.2175        13.7825        189.95730625
## 15  55 39.2175        15.7825        249.08730625
## 16  59 39.2175        19.7825        391.34730625
## 17  38 39.2175        -1.2175          1.48230625
## 18  45 39.2175         5.7825         33.43730625
## 19  35 39.2175        -4.2175         17.78730625
## 20  53 39.2175        13.7825        189.95730625
## 21  18 39.2175       -21.2175        450.18230625
## 22  22 39.2175       -17.2175        296.44230625
## 23  52 39.2175        12.7825        163.39230625
## 24  37 39.2175        -2.2175          4.91730625
## 25  48 39.2175         8.7825         77.13230625
## 26  38 39.2175        -1.2175          1.48230625
## 27  37 39.2175        -2.2175          4.91730625
## 28  44 39.2175         4.7825         22.87230625
## 29  27 39.2175       -12.2175        149.26730625
## 30  45 39.2175         5.7825         33.43730625
## 31  35 39.2175        -4.2175         17.78730625
## 32  40 39.2175         0.7825          0.61230625
## 33  21 39.2175       -18.2175        331.87730625
## 34  55 39.2175        15.7825        249.08730625
## 35  18 39.2175       -21.2175        450.18230625
## 36  28 39.2175       -11.2175        125.83230625
## 37  26 39.2175       -13.2175        174.70230625
## 38  26 39.2175       -13.2175        174.70230625
## 39  31 39.2175        -8.2175         67.52730625
## 40  37 39.2175        -2.2175          4.91730625
## 41  39 39.2175        -0.2175          0.04730625
## 42  37 39.2175        -2.2175          4.91730625
## 43  43 39.2175         3.7825         14.30730625
## 44  25 39.2175       -14.2175        202.13730625
## 45  53 39.2175        13.7825        189.95730625
## 46  58 39.2175        18.7825        352.78230625
## 47  50 39.2175        10.7825        116.26230625
## 48  58 39.2175        18.7825        352.78230625
## 49  24 39.2175       -15.2175        231.57230625
## 50  20 39.2175       -19.2175        369.31230625
## 51  45 39.2175         5.7825         33.43730625
## 52  46 39.2175         6.7825         46.00230625
## 53  29 39.2175       -10.2175        104.39730625
## 54  24 39.2175       -15.2175        231.57230625
## 55  30 39.2175        -9.2175         84.96230625
## 56  37 39.2175        -2.2175          4.91730625
## 57  46 39.2175         6.7825         46.00230625
## 58  56 39.2175        16.7825        281.65230625
## 59  19 39.2175       -20.2175        408.74730625
## 60  20 39.2175       -19.2175        369.31230625
## 61  38 39.2175        -1.2175          1.48230625
## 62  19 39.2175       -20.2175        408.74730625
## 63  47 39.2175         7.7825         60.56730625
## 64  29 39.2175       -10.2175        104.39730625
## 65  21 39.2175       -18.2175        331.87730625
## 66  58 39.2175        18.7825        352.78230625
## 67  24 39.2175       -15.2175        231.57230625
## 68  54 39.2175        14.7825        218.52230625
## 69  57 39.2175        17.7825        316.21730625
## 70  56 39.2175        16.7825        281.65230625
## 71  46 39.2175         6.7825         46.00230625
## 72  32 39.2175        -7.2175         52.09230625
## 73  24 39.2175       -15.2175        231.57230625
## 74  54 39.2175        14.7825        218.52230625
## 75  21 39.2175       -18.2175        331.87730625
## 76  23 39.2175       -16.2175        263.00730625
## 77  47 39.2175         7.7825         60.56730625
## 78  19 39.2175       -20.2175        408.74730625
## 79  59 39.2175        19.7825        391.34730625
## 80  60 39.2175        20.7825        431.91230625
## 81  45 39.2175         5.7825         33.43730625
## 82  39 39.2175        -0.2175          0.04730625
## 83  55 39.2175        15.7825        249.08730625
## 84  26 39.2175       -13.2175        174.70230625
## 85  20 39.2175       -19.2175        369.31230625
## 86  55 39.2175        15.7825        249.08730625
## 87  27 39.2175       -12.2175        149.26730625
## 88  36 39.2175        -3.2175         10.35230625
## 89  59 39.2175        19.7825        391.34730625
## 90  57 39.2175        17.7825        316.21730625
## 91  52 39.2175        12.7825        163.39230625
## 92  33 39.2175        -6.2175         38.65730625
## 93  21 39.2175       -18.2175        331.87730625
## 94  23 39.2175       -16.2175        263.00730625
## 95  43 39.2175         3.7825         14.30730625
## 96  21 39.2175       -18.2175        331.87730625
## 97  54 39.2175        14.7825        218.52230625
## 98  33 39.2175        -6.2175         38.65730625
## 99  35 39.2175        -4.2175         17.78730625
## 100 19 39.2175       -20.2175        408.74730625
## 101 44 39.2175         4.7825         22.87230625
## 102 28 39.2175       -11.2175        125.83230625
## 103 60 39.2175        20.7825        431.91230625
## 104 43 39.2175         3.7825         14.30730625
## 105 35 39.2175        -4.2175         17.78730625
## 106 25 39.2175       -14.2175        202.13730625
## 107 52 39.2175        12.7825        163.39230625
## 108 57 39.2175        17.7825        316.21730625
## 109 24 39.2175       -15.2175        231.57230625
## 110 44 39.2175         4.7825         22.87230625
## 111 30 39.2175        -9.2175         84.96230625
## 112 40 39.2175         0.7825          0.61230625
## 113 37 39.2175        -2.2175          4.91730625
## 114 39 39.2175        -0.2175          0.04730625
## 115 25 39.2175       -14.2175        202.13730625
## 116 30 39.2175        -9.2175         84.96230625
## 117 33 39.2175        -6.2175         38.65730625
## 118 27 39.2175       -12.2175        149.26730625
## 119 33 39.2175        -6.2175         38.65730625
## 120 53 39.2175        13.7825        189.95730625
## 121 31 39.2175        -8.2175         67.52730625
## 122 29 39.2175       -10.2175        104.39730625
## 123 33 39.2175        -6.2175         38.65730625
## 124 22 39.2175       -17.2175        296.44230625
## 125 60 39.2175        20.7825        431.91230625
## 126 44 39.2175         4.7825         22.87230625
## 127 19 39.2175       -20.2175        408.74730625
## 128 60 39.2175        20.7825        431.91230625
## 129 19 39.2175       -20.2175        408.74730625
## 130 57 39.2175        17.7825        316.21730625
## 131 46 39.2175         6.7825         46.00230625
## 132 43 39.2175         3.7825         14.30730625
## 133 36 39.2175        -3.2175         10.35230625
## 134 22 39.2175       -17.2175        296.44230625
## 135 23 39.2175       -16.2175        263.00730625
## 136 19 39.2175       -20.2175        408.74730625
## 137 59 39.2175        19.7825        391.34730625
## 138 41 39.2175         1.7825          3.17730625
## 139 58 39.2175        18.7825        352.78230625
## 140 33 39.2175        -6.2175         38.65730625
## 141 18 39.2175       -21.2175        450.18230625
## 142 33 39.2175        -6.2175         38.65730625
## 143 38 39.2175        -1.2175          1.48230625
## 144 43 39.2175         3.7825         14.30730625
## 145 44 39.2175         4.7825         22.87230625
## 146 24 39.2175       -15.2175        231.57230625
## 147 34 39.2175        -5.2175         27.22230625
## 148 46 39.2175         6.7825         46.00230625
## 149 32 39.2175        -7.2175         52.09230625
## 150 53 39.2175        13.7825        189.95730625
## 151 57 39.2175        17.7825        316.21730625
## 152 24 39.2175       -15.2175        231.57230625
## 153 58 39.2175        18.7825        352.78230625
## 154 50 39.2175        10.7825        116.26230625
## 155 34 39.2175        -5.2175         27.22230625
## 156 34 39.2175        -5.2175         27.22230625
## 157 55 39.2175        15.7825        249.08730625
## 158 43 39.2175         3.7825         14.30730625
## 159 37 39.2175        -2.2175          4.91730625
## 160 48 39.2175         8.7825         77.13230625
## 161 57 39.2175        17.7825        316.21730625
## 162 30 39.2175        -9.2175         84.96230625
## 163 31 39.2175        -8.2175         67.52730625
## 164 39 39.2175        -0.2175          0.04730625
## 165 40 39.2175         0.7825          0.61230625
## 166 47 39.2175         7.7825         60.56730625
## 167 59 39.2175        19.7825        391.34730625
## 168 57 39.2175        17.7825        316.21730625
## 169 41 39.2175         1.7825          3.17730625
## 170 30 39.2175        -9.2175         84.96230625
## 171 33 39.2175        -6.2175         38.65730625
## 172 42 39.2175         2.7825          7.74230625
## 173 31 39.2175        -8.2175         67.52730625
## 174 25 39.2175       -14.2175        202.13730625
## 175 43 39.2175         3.7825         14.30730625
## 176 20 39.2175       -19.2175        369.31230625
## 177 44 39.2175         4.7825         22.87230625
## 178 47 39.2175         7.7825         60.56730625
## 179 30 39.2175        -9.2175         84.96230625
## 180 31 39.2175        -8.2175         67.52730625
## 181 48 39.2175         8.7825         77.13230625
## 182 30 39.2175        -9.2175         84.96230625
## 183 35 39.2175        -4.2175         17.78730625
## 184 19 39.2175       -20.2175        408.74730625
## 185 37 39.2175        -2.2175          4.91730625
## 186 29 39.2175       -10.2175        104.39730625
## 187 34 39.2175        -5.2175         27.22230625
## 188 35 39.2175        -4.2175         17.78730625
## 189 60 39.2175        20.7825        431.91230625
## 190 57 39.2175        17.7825        316.21730625
## 191 18 39.2175       -21.2175        450.18230625
## 192 51 39.2175        11.7825        138.82730625
## 193 57 39.2175        17.7825        316.21730625
## 194 44 39.2175         4.7825         22.87230625
## 195 38 39.2175        -1.2175          1.48230625
## 196 35 39.2175        -4.2175         17.78730625
## 197 34 39.2175        -5.2175         27.22230625
## 198 34 39.2175        -5.2175         27.22230625
## 199 34 39.2175        -5.2175         27.22230625
## 200 53 39.2175        13.7825        189.95730625
## 201 28 39.2175       -11.2175        125.83230625
## 202 26 39.2175       -13.2175        174.70230625
## 203 57 39.2175        17.7825        316.21730625
## 204 37 39.2175        -2.2175          4.91730625
## 205 56 39.2175        16.7825        281.65230625
## 206 42 39.2175         2.7825          7.74230625
## 207 43 39.2175         3.7825         14.30730625
## 208 54 39.2175        14.7825        218.52230625
## 209 42 39.2175         2.7825          7.74230625
## 210 34 39.2175        -5.2175         27.22230625
## 211 57 39.2175        17.7825        316.21730625
## 212 52 39.2175        12.7825        163.39230625
## 213 48 39.2175         8.7825         77.13230625
## 214 38 39.2175        -1.2175          1.48230625
## 215 20 39.2175       -19.2175        369.31230625
## 216 28 39.2175       -11.2175        125.83230625
## 217 34 39.2175        -5.2175         27.22230625
## 218 31 39.2175        -8.2175         67.52730625
## 219 25 39.2175       -14.2175        202.13730625
## 220 19 39.2175       -20.2175        408.74730625
## 221 35 39.2175        -4.2175         17.78730625
## 222 38 39.2175        -1.2175          1.48230625
## 223 44 39.2175         4.7825         22.87230625
## 224 43 39.2175         3.7825         14.30730625
## 225 57 39.2175        17.7825        316.21730625
## 226 34 39.2175        -5.2175         27.22230625
## 227 43 39.2175         3.7825         14.30730625
## 228 21 39.2175       -18.2175        331.87730625
## 229 28 39.2175       -11.2175        125.83230625
## 230 25 39.2175       -14.2175        202.13730625
## 231 57 39.2175        17.7825        316.21730625
## 232 39 39.2175        -0.2175          0.04730625
## 233 22 39.2175       -17.2175        296.44230625
## 234 51 39.2175        11.7825        138.82730625
## 235 27 39.2175       -12.2175        149.26730625
## 236 37 39.2175        -2.2175          4.91730625
## 237 45 39.2175         5.7825         33.43730625
## 238 52 39.2175        12.7825        163.39230625
## 239 53 39.2175        13.7825        189.95730625
## 240 53 39.2175        13.7825        189.95730625
## 241 47 39.2175         7.7825         60.56730625
## 242 29 39.2175       -10.2175        104.39730625
## 243 47 39.2175         7.7825         60.56730625
## 244 59 39.2175        19.7825        391.34730625
## 245 38 39.2175        -1.2175          1.48230625
## 246 47 39.2175         7.7825         60.56730625
## 247 54 39.2175        14.7825        218.52230625
## 248 20 39.2175       -19.2175        369.31230625
## 249 49 39.2175         9.7825         95.69730625
## 250 28 39.2175       -11.2175        125.83230625
## 251 40 39.2175         0.7825          0.61230625
## 252 45 39.2175         5.7825         33.43730625
## 253 35 39.2175        -4.2175         17.78730625
## 254 50 39.2175        10.7825        116.26230625
## 255 59 39.2175        19.7825        391.34730625
## 256 29 39.2175       -10.2175        104.39730625
## 257 51 39.2175        11.7825        138.82730625
## 258 27 39.2175       -12.2175        149.26730625
## 259 49 39.2175         9.7825         95.69730625
## 260 42 39.2175         2.7825          7.74230625
## 261 49 39.2175         9.7825         95.69730625
## 262 49 39.2175         9.7825         95.69730625
## 263 25 39.2175       -14.2175        202.13730625
## 264 33 39.2175        -6.2175         38.65730625
## 265 40 39.2175         0.7825          0.61230625
## 266 48 39.2175         8.7825         77.13230625
## 267 43 39.2175         3.7825         14.30730625
## 268 41 39.2175         1.7825          3.17730625
## 269 42 39.2175         2.7825          7.74230625
## 270 25 39.2175       -14.2175        202.13730625
## 271 50 39.2175        10.7825        116.26230625
## 272 41 39.2175         1.7825          3.17730625
## 273 18 39.2175       -21.2175        450.18230625
## 274 54 39.2175        14.7825        218.52230625
## 275 35 39.2175        -4.2175         17.78730625
## 276 51 39.2175        11.7825        138.82730625
## 277 40 39.2175         0.7825          0.61230625
## 278 29 39.2175       -10.2175        104.39730625
## 279 27 39.2175       -12.2175        149.26730625
## 280 42 39.2175         2.7825          7.74230625
## 281 44 39.2175         4.7825         22.87230625
## 282 46 39.2175         6.7825         46.00230625
## 283 37 39.2175        -2.2175          4.91730625
## 284 26 39.2175       -13.2175        174.70230625
## 285 41 39.2175         1.7825          3.17730625
## 286 47 39.2175         7.7825         60.56730625
## 287 35 39.2175        -4.2175         17.78730625
## 288 28 39.2175       -11.2175        125.83230625
## 289 33 39.2175        -6.2175         38.65730625
## 290 48 39.2175         8.7825         77.13230625
## 291 33 39.2175        -6.2175         38.65730625
## 292 37 39.2175        -2.2175          4.91730625
## 293 53 39.2175        13.7825        189.95730625
## 294 49 39.2175         9.7825         95.69730625
## 295 54 39.2175        14.7825        218.52230625
## 296 54 39.2175        14.7825        218.52230625
## 297 53 39.2175        13.7825        189.95730625
## 298 49 39.2175         9.7825         95.69730625
## 299 44 39.2175         4.7825         22.87230625
## 300 38 39.2175        -1.2175          1.48230625
## 301 22 39.2175       -17.2175        296.44230625
## 302 39 39.2175        -0.2175          0.04730625
## 303 55 39.2175        15.7825        249.08730625
## 304 43 39.2175         3.7825         14.30730625
## 305 38 39.2175        -1.2175          1.48230625
## 306 26 39.2175       -13.2175        174.70230625
## 307 48 39.2175         8.7825         77.13230625
## 308 31 39.2175        -8.2175         67.52730625
## 309 18 39.2175       -21.2175        450.18230625
## 310 53 39.2175        13.7825        189.95730625
## 311 44 39.2175         4.7825         22.87230625
## 312 60 39.2175        20.7825        431.91230625
## 313 31 39.2175        -8.2175         67.52730625
## 314 39 39.2175        -0.2175          0.04730625
## 315 59 39.2175        19.7825        391.34730625
## 316 40 39.2175         0.7825          0.61230625
## 317 36 39.2175        -3.2175         10.35230625
## 318 21 39.2175       -18.2175        331.87730625
## 319 26 39.2175       -13.2175        174.70230625
## 320 59 39.2175        19.7825        391.34730625
## 321 25 39.2175       -14.2175        202.13730625
## 322 33 39.2175        -6.2175         38.65730625
## 323 32 39.2175        -7.2175         52.09230625
## 324 27 39.2175       -12.2175        149.26730625
## 325 60 39.2175        20.7825        431.91230625
## 326 22 39.2175       -17.2175        296.44230625
## 327 19 39.2175       -20.2175        408.74730625
## 328 25 39.2175       -14.2175        202.13730625
## 329 33 39.2175        -6.2175         38.65730625
## 330 58 39.2175        18.7825        352.78230625
## 331 54 39.2175        14.7825        218.52230625
## 332 40 39.2175         0.7825          0.61230625
## 333 46 39.2175         6.7825         46.00230625
## 334 36 39.2175        -3.2175         10.35230625
## 335 46 39.2175         6.7825         46.00230625
## 336 51 39.2175        11.7825        138.82730625
## 337 50 39.2175        10.7825        116.26230625
## 338 29 39.2175       -10.2175        104.39730625
## 339 26 39.2175       -13.2175        174.70230625
## 340 54 39.2175        14.7825        218.52230625
## 341 42 39.2175         2.7825          7.74230625
## 342 40 39.2175         0.7825          0.61230625
## 343 34 39.2175        -5.2175         27.22230625
## 344 21 39.2175       -18.2175        331.87730625
## 345 24 39.2175       -15.2175        231.57230625
## 346 50 39.2175        10.7825        116.26230625
## 347 33 39.2175        -6.2175         38.65730625
## 348 46 39.2175         6.7825         46.00230625
## 349 25 39.2175       -14.2175        202.13730625
## 350 59 39.2175        19.7825        391.34730625
## 351 53 39.2175        13.7825        189.95730625
## 352 32 39.2175        -7.2175         52.09230625
## 353 31 39.2175        -8.2175         67.52730625
## 354 26 39.2175       -13.2175        174.70230625
## 355 18 39.2175       -21.2175        450.18230625
## 356 54 39.2175        14.7825        218.52230625
## 357 30 39.2175        -9.2175         84.96230625
## 358 22 39.2175       -17.2175        296.44230625
## 359 21 39.2175       -18.2175        331.87730625
## 360 20 39.2175       -19.2175        369.31230625
## 361 19 39.2175       -20.2175        408.74730625
## 362 58 39.2175        18.7825        352.78230625
## 363 58 39.2175        18.7825        352.78230625
## 364 25 39.2175       -14.2175        202.13730625
## 365 48 39.2175         8.7825         77.13230625
## 366 45 39.2175         5.7825         33.43730625
## 367 48 39.2175         8.7825         77.13230625
## 368 31 39.2175        -8.2175         67.52730625
## 369 60 39.2175        20.7825        431.91230625
## 370 24 39.2175       -15.2175        231.57230625
## 371 38 39.2175        -1.2175          1.48230625
## 372 40 39.2175         0.7825          0.61230625
## 373 49 39.2175         9.7825         95.69730625
## 374 38 39.2175        -1.2175          1.48230625
## 375 58 39.2175        18.7825        352.78230625
## 376 42 39.2175         2.7825          7.74230625
## 377 58 39.2175        18.7825        352.78230625
## 378 56 39.2175        16.7825        281.65230625
## 379 40 39.2175         0.7825          0.61230625
## 380 51 39.2175        11.7825        138.82730625
## 381 43 39.2175         3.7825         14.30730625
## 382 41 39.2175         1.7825          3.17730625
## 383 59 39.2175        19.7825        391.34730625
## 384 35 39.2175        -4.2175         17.78730625
## 385 18 39.2175       -21.2175        450.18230625
## 386 48 39.2175         8.7825         77.13230625
## 387 31 39.2175        -8.2175         67.52730625
## 388 43 39.2175         3.7825         14.30730625
## 389 23 39.2175       -16.2175        263.00730625
## 390 43 39.2175         3.7825         14.30730625
## 391 30 39.2175        -9.2175         84.96230625
## 392 60 39.2175        20.7825        431.91230625
## 393 59 39.2175        19.7825        391.34730625
## 394 36 39.2175        -3.2175         10.35230625
## 395 37 39.2175        -2.2175          4.91730625
## 396 39 39.2175        -0.2175          0.04730625
## 397 34 39.2175        -5.2175         27.22230625
## 398 19 39.2175       -20.2175        408.74730625
## 399 56 39.2175        16.7825        281.65230625
## 400 23 39.2175       -16.2175        263.00730625

Calculando la suma y determinando varianza

n <- length(edades1)
suma <- sum(tabla.varianza.edades1$xi.menos.media.cuad)
suma
## [1] 59956.08
varianza <- suma / (n -1)
varianza
## [1] 150.2659

Con las funciones de var() y sd() se determinan la varianza y a desviación respectivamente y con mean() la media de la muestra.

varianza_edades1 <- var(edades1)
varianza_edades2 <- var(edades2)
desv.std_edades1 <- sd(edades1)
desv.std_edades2 <- sd(edades2)

Se muestran los valores generados, el punto y coma en R significa en una misma linea se ejecutan dos instrucciones o dos comandos, en este caso solo mostrar los valores.

varianza_edades1; varianza_edades2
## [1] 150.2659
## [1] 25.46165
desv.std_edades1; desv.std_edades2 
## [1] 12.2583
## [1] 5.045954

4.3.3 Coeficiente de variación

El coeficiente de variación (CV) es un estadístico que permite comparar entre dos o mas conjuntos de datos cuál es estos tiene una dispersión mayor o menor.

Al identificar el CV de un conjunto de datos y compararlo con otro CV de otro conjunto de datos similares, se puede determinar cual de los datos tiene mayor o menor dispersión y se puede concluir en cual es estos está mas dispersos sus datos, es decir cuál de ellos se aleja mas o menos de la media, según sea el caso.

Para determinar el coeficiente de variación se establece la división de la desviación estándar entre la media del conjunto de datos.

\[ CV = \frac{\sigma}{\bar{x}} \]

CV_edades1 <- desv.std_edades1 / media_edades1
CV_edades1
## [1] 0.3125721
CV_edades2 <- desv.std_edades2 / media_edades2
CV_edades2
## [1] 0.1694552

5 Interpretación

¿Qué representan las tablas de frecuencias para los datos edades?

La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente. Frecuencia absoluta: La frecuencia absoluta o simplemente frecuencia es el número de veces que aparece un determinado valor en un estudio estadístico.

Con respecto a edades1 existe un 4,2% de valores que están en un rango o intervalo entre 17,82 y 60.6.

En relación a edades2 existe una cantidad de valores entre 36.83 y 46.34 que representan el 14.5%.

¿Cuáles son los valores media y desviación de los conjuntos de datos edades?

Con respecto a los valores estadísticos del conjunto de datos edades1, el valor la media es de: 39.21, la desviación es de: 31201.58.

Con respecto a los valores estadísticos del conjunto de datos edades2, el valor la media es de: 29.605, la desviación es de: 156.7919.

¿Cuáles son los valores de coeficiente de variación para los conjuntos de datos edades y que representan?

El coeficiente de variación de edades1 es de: 0.3243112 y el CV de edades2 es de: 0.1750384

Existe mayor dispersión en los valores del conjunto de datos edades1 con respecto a edades2 por tener ligeramente mayor valor en su coeficiente de variación.

6 Bibliografía