1 Objetivo

Determinar medidas de dispersión de datos como edades, sueldos y calificaciones.

2 Descripción

  • Simular muestra de varios conjuntos de datos

  • Se identifica media de los datos

  • Se muestran tablas de frecuencias

  • Se calculan medidas de dispersión, varianza y desviación estándar.

  • Se visualiza la dispersión de los datos en relación a la media.

  • Se calcula el coeficiente de variación y se compara con similares conjuntos de datos.

3 Marco teórico

¿Para que sirven las medidas de dispersión?

El reporte de una medida de centralización como la media, mediana y moda sólo da información parcial sobre un conjunto o distribución de datos. Diferentes muestras o poblaciones pueden tener medidas idénticas de centro y aun así diferir una de otra en otras importantes maneras. [@devore2016a].

La imagen siguiente muestra tres conjuntos de datos y los tres tienen media y mediana igual, sin embargo la dispersión es diferentes, es decir cual conjunto de datos se aleja mas de la media.

La primera tiene la cantidad más grande de variabilidad, la tercera tiene la cantidad más pequeña y la segunda es intermedia respecto a las otras dos en este aspecto. [@devore2016].

3.1 Varianza

La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está basada en la diferencia entre el valor de cada observación (\(x_i\)) y la media \(\bar{x}\) [@anderson2008].

3.1.1 Fórmulas

Se identifican las fórmulas para varianza poblacional y muestral, dependiendo de los datos a analizar, si es todas las observaciones de la población y solo una muestra de la misma.

Para efectos de este ejercicio se utiliza mas específicamente la varianza y desviación muestral.

3.1.1.1 Fórmula de varianza poblacional

\[ \sigma^2 = \frac{\sum_{i=1}^N(x_i- \mu)^2}{N} \]

siendo \(\mu\) la media poblacional y \(N\) el total de los datos de la población.

3.1.1.2 Fórmula de varianza muestral

\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]

siendo \(\bar{x}\) la media muestral y \(n\) el total de los datos de la muestra.

Las unidades al cuadrado de la varianza dificultan la comprensión e interpretación intuitiva de los valores numéricos de la varianza.

3.2 Desviación estándar

La desviación estándar se define como la raíz cuadrada positiva de la varianza.

Continuando con la notación adoptada para la varianza muestral y para la varianza poblacional, se emplea \(\varsigma\) para denotar la desviación estándar muestral y \(\sigma\) para denotar la desviación estándar poblacional.

¿Qué se gana con convertir la varianza en la correspondiente desviación estándar?.

Como la desviación estándar es la raíz cuadrada de la varianza, las unidades de la varianza, son al cuadrado, posiblemente dificulta su interpretación, por tanto, la desviación estándar de se interpreta de mejor manera la variabilidad de los datos porque el valor resultante se mide en las mismas unidades que los datos originales. [@anderson2008].

Una interpretación preliminar de la desviación estándar muestral es que es el tamaño de una desviación típica o representativa de la media muestral dentro de la muestra dada.[@devore2016]

3.2.1 Fórmula de desviación estándar poblacional

\[ \sigma = \sqrt{\sigma^2} \]

3.2.2 Fórmula de desviación estándar muestral

\[ S = \sqrt{S^2} \]

3.3 Coeficiente de variación (CV)

En algunas ocasiones se requiere un estadístico descriptivo que indique cuán grande es la desviación estándar en relación con la media. Existe el coeficiente de variación y resuelve ese propósito.

La fórmula del coeficiente de variación indica el grado de dispersión de un conjunto de datos con respecto a la media.

\[ CV = \left(\frac{\sigma}{\bar{x}} \times 100 \right) \text{%} \]

4 Desarrollo

4.1 Librerías

Instalar librerías anticipadamente con install.packages(“fdth”)

library(fdth)    # Para tablas de frecuencias
library(ggplot2) # Para gráficos

4.2 Datos edades

Se establece valor de semilla para que se generen los mismos datos.

set.seed(8000)

Se generan 300 edades en dos conjuntos de datos diferentes.

edades1 se genera con función de aleatoriedad sample()

edades2 se genera con la función de distribución normal rnorm().

n <- 300
edades1 <- sample(x = 18:60,size = n,replace = TRUE )

4.2.1 edades1

4.2.1.1 Mostrar los datos edades1

Se identifican los datos edades1

edades1
##   [1] 47 48 52 21 28 26 24 31 44 55 44 45 50 28 21 30 37 36 21 54 45 37 28 42 57
##  [26] 38 27 28 23 57 19 42 23 50 42 49 51 40 43 56 39 20 45 50 57 60 56 44 36 52
##  [51] 26 56 29 49 28 43 26 48 50 39 56 32 28 40 39 39 23 51 60 58 19 42 26 53 59
##  [76] 59 39 43 44 27 57 59 57 23 57 56 21 49 29 23 26 23 48 53 25 26 60 22 20 43
## [101] 30 58 28 43 59 39 28 26 55 23 59 41 43 20 48 59 33 20 60 45 25 56 39 28 51
## [126] 53 50 45 19 30 58 43 56 36 58 46 47 51 58 27 42 52 22 39 26 20 25 25 50 25
## [151] 34 47 59 56 20 43 53 48 29 46 28 43 59 44 26 44 49 57 27 36 25 21 57 43 31
## [176] 58 54 30 29 37 18 54 28 25 31 48 40 42 20 54 57 18 53 49 39 37 30 21 28 52
## [201] 58 18 36 38 36 19 41 26 52 60 38 24 34 26 55 48 29 37 47 58 54 28 21 39 40
## [226] 60 39 47 45 51 56 60 29 38 48 55 52 60 37 42 46 47 45 26 41 49 19 44 19 53
## [251] 35 38 25 23 48 37 43 24 29 50 29 35 42 26 29 40 36 38 38 21 56 33 19 44 21
## [276] 49 18 23 53 39 59 43 33 44 24 38 51 48 18 46 43 22 54 20 54 41 56 52 36 32

4.2.1.2 Tablas de frecuencias edades1

Se muestran las tablas de frecuencias del conjunto de datos edades1.

En las tablas de frecuencias se determina matemáticamente el número de clases, La opción matemáticamente más consistente es la conocida como regla de Sturges.

La solución de esta ecuación proporciona una regla práctica para obtener el número de clases.

\[ k=1+3.322*log10(n) \]

  • Siendo k el número de clases

  • log es la función logarítmica de base 10, log10()

  • y n el total de la muestra

El rango de clase de acuerdo a Sturges está dada por \[ h=\frac{max(datos) - min(datos)}{k} \]Siendo h el rango de cada clase y max(datos) - min(datos) el rango del total de los datos, es decir la diferencia entre límite superior menos límite inferior.

Existen otras formas de determinar el número de clases a utilizar, algunas más complejas, otras más simples.

Independientemente de la forma de cálculo seleccionada ya se Sturges, Scott o Freedman-Diaconis (FD), lo realmente importante es que la información mostrada en la tabla de frecuencia sea fácil de revisar, que no contenga un número excesivo de clases y que la información que en ella se refleja permita comprender cómo se presentan los datos en la población o de una muestra.

El número de clase de acuerdo par \(n=300\) de acuerdo a Sturges es:

k  <- round(1+3.322 * log10(n))
k
## [1] 9

La amplitud h1 y h2 para cada conjunto de datos es igual a:

h = diff(range(edades1)) / k
h
## [1] 4.666667
tabla.edades1 <- fdt(x = edades1, breaks="Sturges")
tabla.edades1
##   Class limits  f   rf rf(%)  cf  cf(%)
##   [17.82,22.1) 32 0.11 10.67  32  10.67
##   [22.1,26.38) 34 0.11 11.33  66  22.00
##  [26.38,30.65) 31 0.10 10.33  97  32.33
##  [30.65,34.93) 10 0.03  3.33 107  35.67
##  [34.93,39.21) 37 0.12 12.33 144  48.00
##  [39.21,43.49) 30 0.10 10.00 174  58.00
##  [43.49,47.77) 26 0.09  8.67 200  66.67
##  [47.77,52.04) 37 0.12 12.33 237  79.00
##  [52.04,56.32) 29 0.10  9.67 266  88.67
##   [56.32,60.6) 34 0.11 11.33 300 100.00
  • Class limits significa el rango de cada clase

  • f significa la frecuencia, la suma de f debe ser el total de elementos.

  • rf significa frecuencia relativa la suma de todas las rf debe ser el 1

  • rf% significa el valor relativo pero en porcentaje, la suma de rf% debe ser el 100%

  • cf significa frecuencia acumulada

  • cf% significa frecuencia porcentual acumulada

4.2.1.3 Histograma de edades1

hist(edades1, breaks = "Sturges" ) 

4.2.1.4 Dispersión de edades1

datos.edades1 <- data.frame(x = 1:length(edades1), edad= edades1)
ggplot(datos.edades1, aes(x=x, y=edad))+
  geom_point() +
  geom_hline(yintercept = mean(edades1), col='red') +
  ggtitle(label = "Dispersión de edades1", subtitle = paste("media = ", mean(edades1)))

4.2.2 edades2

4.2.2.1 Crear y mostrrar los datos edades2

edades2 <- round(rnorm(n = n, mean = 30, sd = 5))

Se identifican los datos edades2

sort(edades2)
##   [1] 15 16 18 18 19 19 19 20 20 20 21 21 21 21 21 21 22 22 22 22 23 23 23 23 23
##  [26] 23 24 24 24 24 24 24 24 24 24 24 24 24 24 24 25 25 25 25 25 25 25 25 25 25
##  [51] 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 27 27
##  [76] 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 28 28 28 28 28 28 28 28
## [101] 28 28 28 28 28 28 28 28 28 28 28 28 29 29 29 29 29 29 29 29 29 29 29 29 29
## [126] 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 30 30 30 30 30 30 30 30 30
## [151] 30 30 30 30 30 30 30 30 30 30 30 30 30 31 31 31 31 31 31 31 31 31 31 31 31
## [176] 31 31 31 31 31 31 31 31 31 31 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32
## [201] 32 32 32 32 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33
## [226] 33 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 35
## [251] 35 35 35 35 35 35 35 35 35 35 35 36 36 36 36 36 36 36 36 37 37 37 37 37 37
## [276] 37 38 38 38 38 38 39 39 39 39 39 39 40 41 41 41 41 41 41 41 43 43 43 43 45

4.2.2.2 Tablas de frecuencias edades2

Se muestran las tablas de frecuencias del conjunto de datos edades2.

tabla.edades2 <- fdt(x = edades2, breaks="Sturges")
tabla.edades2
##   Class limits  f   rf rf(%)  cf  cf(%)
##  [14.85,17.91)  2 0.01  0.67   2   0.67
##  [17.91,20.97)  8 0.03  2.67  10   3.33
##  [20.97,24.03) 30 0.10 10.00  40  13.33
##  [24.03,27.09) 52 0.17 17.33  92  30.67
##  [27.09,30.15) 71 0.24 23.67 163  54.33
##  [30.15,33.21) 63 0.21 21.00 226  75.33
##  [33.21,36.27) 43 0.14 14.33 269  89.67
##  [36.27,39.33) 18 0.06  6.00 287  95.67
##  [39.33,42.39)  8 0.03  2.67 295  98.33
##  [42.39,45.45)  5 0.02  1.67 300 100.00

4.2.2.3 Histograma de edades2

hist(edades2, breaks = "Sturges" ) 

4.2.2.4 Dispersión de edades2

datos.edades2 <- data.frame(x = 1:length(edades2), edad= edades2)
ggplot(datos.edades2, aes(x=x, y=edad))+
  geom_point() +
  geom_hline(yintercept = mean(edades2), col='red') +
  ggtitle(label = "Dispersión de edades2", subtitle = paste("media = ", mean(edades2)))

4.3 Medidas de dispersión

Las medidas de dispersión varianza y desviación estándar miden el valor de dispersión de un conjunto de datos numéricos.

La dispersión significa que tanto los datos están alejados de la media, el valor de la desviación se compara con la media y se interpreta que tanto los valores distan del valor de la media.

4.3.1 Medias aritméticas de edades

media_edades1 <- mean(edades1)
media_edades2 <- mean(edades2)
media_edades1; media_edades2 
## [1] 39.75667
## [1] 30.09

4.3.2 Varianza y desviación estándar

\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]

\[ S = \sqrt{S^{2}} \]

tabla.varianza.edades1 <- data.frame(x = edades1,
  x_media = media_edades1,
  xi.menos.media = edades1 - media_edades1,
  xi.menos.media.cuad = (edades1 - media_edades1)^2)
tabla.varianza.edades1
##      x  x_media xi.menos.media xi.menos.media.cuad
## 1   47 39.75667      7.2433333         52.46587778
## 2   48 39.75667      8.2433333         67.95254444
## 3   52 39.75667     12.2433333        149.89921111
## 4   21 39.75667    -18.7566667        351.81254444
## 5   28 39.75667    -11.7566667        138.21921111
## 6   26 39.75667    -13.7566667        189.24587778
## 7   24 39.75667    -15.7566667        248.27254444
## 8   31 39.75667     -8.7566667         76.67921111
## 9   44 39.75667      4.2433333         18.00587778
## 10  55 39.75667     15.2433333        232.35921111
## 11  44 39.75667      4.2433333         18.00587778
## 12  45 39.75667      5.2433333         27.49254444
## 13  50 39.75667     10.2433333        104.92587778
## 14  28 39.75667    -11.7566667        138.21921111
## 15  21 39.75667    -18.7566667        351.81254444
## 16  30 39.75667     -9.7566667         95.19254444
## 17  37 39.75667     -2.7566667          7.59921111
## 18  36 39.75667     -3.7566667         14.11254444
## 19  21 39.75667    -18.7566667        351.81254444
## 20  54 39.75667     14.2433333        202.87254444
## 21  45 39.75667      5.2433333         27.49254444
## 22  37 39.75667     -2.7566667          7.59921111
## 23  28 39.75667    -11.7566667        138.21921111
## 24  42 39.75667      2.2433333          5.03254444
## 25  57 39.75667     17.2433333        297.33254444
## 26  38 39.75667     -1.7566667          3.08587778
## 27  27 39.75667    -12.7566667        162.73254444
## 28  28 39.75667    -11.7566667        138.21921111
## 29  23 39.75667    -16.7566667        280.78587778
## 30  57 39.75667     17.2433333        297.33254444
## 31  19 39.75667    -20.7566667        430.83921111
## 32  42 39.75667      2.2433333          5.03254444
## 33  23 39.75667    -16.7566667        280.78587778
## 34  50 39.75667     10.2433333        104.92587778
## 35  42 39.75667      2.2433333          5.03254444
## 36  49 39.75667      9.2433333         85.43921111
## 37  51 39.75667     11.2433333        126.41254444
## 38  40 39.75667      0.2433333          0.05921111
## 39  43 39.75667      3.2433333         10.51921111
## 40  56 39.75667     16.2433333        263.84587778
## 41  39 39.75667     -0.7566667          0.57254444
## 42  20 39.75667    -19.7566667        390.32587778
## 43  45 39.75667      5.2433333         27.49254444
## 44  50 39.75667     10.2433333        104.92587778
## 45  57 39.75667     17.2433333        297.33254444
## 46  60 39.75667     20.2433333        409.79254444
## 47  56 39.75667     16.2433333        263.84587778
## 48  44 39.75667      4.2433333         18.00587778
## 49  36 39.75667     -3.7566667         14.11254444
## 50  52 39.75667     12.2433333        149.89921111
## 51  26 39.75667    -13.7566667        189.24587778
## 52  56 39.75667     16.2433333        263.84587778
## 53  29 39.75667    -10.7566667        115.70587778
## 54  49 39.75667      9.2433333         85.43921111
## 55  28 39.75667    -11.7566667        138.21921111
## 56  43 39.75667      3.2433333         10.51921111
## 57  26 39.75667    -13.7566667        189.24587778
## 58  48 39.75667      8.2433333         67.95254444
## 59  50 39.75667     10.2433333        104.92587778
## 60  39 39.75667     -0.7566667          0.57254444
## 61  56 39.75667     16.2433333        263.84587778
## 62  32 39.75667     -7.7566667         60.16587778
## 63  28 39.75667    -11.7566667        138.21921111
## 64  40 39.75667      0.2433333          0.05921111
## 65  39 39.75667     -0.7566667          0.57254444
## 66  39 39.75667     -0.7566667          0.57254444
## 67  23 39.75667    -16.7566667        280.78587778
## 68  51 39.75667     11.2433333        126.41254444
## 69  60 39.75667     20.2433333        409.79254444
## 70  58 39.75667     18.2433333        332.81921111
## 71  19 39.75667    -20.7566667        430.83921111
## 72  42 39.75667      2.2433333          5.03254444
## 73  26 39.75667    -13.7566667        189.24587778
## 74  53 39.75667     13.2433333        175.38587778
## 75  59 39.75667     19.2433333        370.30587778
## 76  59 39.75667     19.2433333        370.30587778
## 77  39 39.75667     -0.7566667          0.57254444
## 78  43 39.75667      3.2433333         10.51921111
## 79  44 39.75667      4.2433333         18.00587778
## 80  27 39.75667    -12.7566667        162.73254444
## 81  57 39.75667     17.2433333        297.33254444
## 82  59 39.75667     19.2433333        370.30587778
## 83  57 39.75667     17.2433333        297.33254444
## 84  23 39.75667    -16.7566667        280.78587778
## 85  57 39.75667     17.2433333        297.33254444
## 86  56 39.75667     16.2433333        263.84587778
## 87  21 39.75667    -18.7566667        351.81254444
## 88  49 39.75667      9.2433333         85.43921111
## 89  29 39.75667    -10.7566667        115.70587778
## 90  23 39.75667    -16.7566667        280.78587778
## 91  26 39.75667    -13.7566667        189.24587778
## 92  23 39.75667    -16.7566667        280.78587778
## 93  48 39.75667      8.2433333         67.95254444
## 94  53 39.75667     13.2433333        175.38587778
## 95  25 39.75667    -14.7566667        217.75921111
## 96  26 39.75667    -13.7566667        189.24587778
## 97  60 39.75667     20.2433333        409.79254444
## 98  22 39.75667    -17.7566667        315.29921111
## 99  20 39.75667    -19.7566667        390.32587778
## 100 43 39.75667      3.2433333         10.51921111
## 101 30 39.75667     -9.7566667         95.19254444
## 102 58 39.75667     18.2433333        332.81921111
## 103 28 39.75667    -11.7566667        138.21921111
## 104 43 39.75667      3.2433333         10.51921111
## 105 59 39.75667     19.2433333        370.30587778
## 106 39 39.75667     -0.7566667          0.57254444
## 107 28 39.75667    -11.7566667        138.21921111
## 108 26 39.75667    -13.7566667        189.24587778
## 109 55 39.75667     15.2433333        232.35921111
## 110 23 39.75667    -16.7566667        280.78587778
## 111 59 39.75667     19.2433333        370.30587778
## 112 41 39.75667      1.2433333          1.54587778
## 113 43 39.75667      3.2433333         10.51921111
## 114 20 39.75667    -19.7566667        390.32587778
## 115 48 39.75667      8.2433333         67.95254444
## 116 59 39.75667     19.2433333        370.30587778
## 117 33 39.75667     -6.7566667         45.65254444
## 118 20 39.75667    -19.7566667        390.32587778
## 119 60 39.75667     20.2433333        409.79254444
## 120 45 39.75667      5.2433333         27.49254444
## 121 25 39.75667    -14.7566667        217.75921111
## 122 56 39.75667     16.2433333        263.84587778
## 123 39 39.75667     -0.7566667          0.57254444
## 124 28 39.75667    -11.7566667        138.21921111
## 125 51 39.75667     11.2433333        126.41254444
## 126 53 39.75667     13.2433333        175.38587778
## 127 50 39.75667     10.2433333        104.92587778
## 128 45 39.75667      5.2433333         27.49254444
## 129 19 39.75667    -20.7566667        430.83921111
## 130 30 39.75667     -9.7566667         95.19254444
## 131 58 39.75667     18.2433333        332.81921111
## 132 43 39.75667      3.2433333         10.51921111
## 133 56 39.75667     16.2433333        263.84587778
## 134 36 39.75667     -3.7566667         14.11254444
## 135 58 39.75667     18.2433333        332.81921111
## 136 46 39.75667      6.2433333         38.97921111
## 137 47 39.75667      7.2433333         52.46587778
## 138 51 39.75667     11.2433333        126.41254444
## 139 58 39.75667     18.2433333        332.81921111
## 140 27 39.75667    -12.7566667        162.73254444
## 141 42 39.75667      2.2433333          5.03254444
## 142 52 39.75667     12.2433333        149.89921111
## 143 22 39.75667    -17.7566667        315.29921111
## 144 39 39.75667     -0.7566667          0.57254444
## 145 26 39.75667    -13.7566667        189.24587778
## 146 20 39.75667    -19.7566667        390.32587778
## 147 25 39.75667    -14.7566667        217.75921111
## 148 25 39.75667    -14.7566667        217.75921111
## 149 50 39.75667     10.2433333        104.92587778
## 150 25 39.75667    -14.7566667        217.75921111
## 151 34 39.75667     -5.7566667         33.13921111
## 152 47 39.75667      7.2433333         52.46587778
## 153 59 39.75667     19.2433333        370.30587778
## 154 56 39.75667     16.2433333        263.84587778
## 155 20 39.75667    -19.7566667        390.32587778
## 156 43 39.75667      3.2433333         10.51921111
## 157 53 39.75667     13.2433333        175.38587778
## 158 48 39.75667      8.2433333         67.95254444
## 159 29 39.75667    -10.7566667        115.70587778
## 160 46 39.75667      6.2433333         38.97921111
## 161 28 39.75667    -11.7566667        138.21921111
## 162 43 39.75667      3.2433333         10.51921111
## 163 59 39.75667     19.2433333        370.30587778
## 164 44 39.75667      4.2433333         18.00587778
## 165 26 39.75667    -13.7566667        189.24587778
## 166 44 39.75667      4.2433333         18.00587778
## 167 49 39.75667      9.2433333         85.43921111
## 168 57 39.75667     17.2433333        297.33254444
## 169 27 39.75667    -12.7566667        162.73254444
## 170 36 39.75667     -3.7566667         14.11254444
## 171 25 39.75667    -14.7566667        217.75921111
## 172 21 39.75667    -18.7566667        351.81254444
## 173 57 39.75667     17.2433333        297.33254444
## 174 43 39.75667      3.2433333         10.51921111
## 175 31 39.75667     -8.7566667         76.67921111
## 176 58 39.75667     18.2433333        332.81921111
## 177 54 39.75667     14.2433333        202.87254444
## 178 30 39.75667     -9.7566667         95.19254444
## 179 29 39.75667    -10.7566667        115.70587778
## 180 37 39.75667     -2.7566667          7.59921111
## 181 18 39.75667    -21.7566667        473.35254444
## 182 54 39.75667     14.2433333        202.87254444
## 183 28 39.75667    -11.7566667        138.21921111
## 184 25 39.75667    -14.7566667        217.75921111
## 185 31 39.75667     -8.7566667         76.67921111
## 186 48 39.75667      8.2433333         67.95254444
## 187 40 39.75667      0.2433333          0.05921111
## 188 42 39.75667      2.2433333          5.03254444
## 189 20 39.75667    -19.7566667        390.32587778
## 190 54 39.75667     14.2433333        202.87254444
## 191 57 39.75667     17.2433333        297.33254444
## 192 18 39.75667    -21.7566667        473.35254444
## 193 53 39.75667     13.2433333        175.38587778
## 194 49 39.75667      9.2433333         85.43921111
## 195 39 39.75667     -0.7566667          0.57254444
## 196 37 39.75667     -2.7566667          7.59921111
## 197 30 39.75667     -9.7566667         95.19254444
## 198 21 39.75667    -18.7566667        351.81254444
## 199 28 39.75667    -11.7566667        138.21921111
## 200 52 39.75667     12.2433333        149.89921111
## 201 58 39.75667     18.2433333        332.81921111
## 202 18 39.75667    -21.7566667        473.35254444
## 203 36 39.75667     -3.7566667         14.11254444
## 204 38 39.75667     -1.7566667          3.08587778
## 205 36 39.75667     -3.7566667         14.11254444
## 206 19 39.75667    -20.7566667        430.83921111
## 207 41 39.75667      1.2433333          1.54587778
## 208 26 39.75667    -13.7566667        189.24587778
## 209 52 39.75667     12.2433333        149.89921111
## 210 60 39.75667     20.2433333        409.79254444
## 211 38 39.75667     -1.7566667          3.08587778
## 212 24 39.75667    -15.7566667        248.27254444
## 213 34 39.75667     -5.7566667         33.13921111
## 214 26 39.75667    -13.7566667        189.24587778
## 215 55 39.75667     15.2433333        232.35921111
## 216 48 39.75667      8.2433333         67.95254444
## 217 29 39.75667    -10.7566667        115.70587778
## 218 37 39.75667     -2.7566667          7.59921111
## 219 47 39.75667      7.2433333         52.46587778
## 220 58 39.75667     18.2433333        332.81921111
## 221 54 39.75667     14.2433333        202.87254444
## 222 28 39.75667    -11.7566667        138.21921111
## 223 21 39.75667    -18.7566667        351.81254444
## 224 39 39.75667     -0.7566667          0.57254444
## 225 40 39.75667      0.2433333          0.05921111
## 226 60 39.75667     20.2433333        409.79254444
## 227 39 39.75667     -0.7566667          0.57254444
## 228 47 39.75667      7.2433333         52.46587778
## 229 45 39.75667      5.2433333         27.49254444
## 230 51 39.75667     11.2433333        126.41254444
## 231 56 39.75667     16.2433333        263.84587778
## 232 60 39.75667     20.2433333        409.79254444
## 233 29 39.75667    -10.7566667        115.70587778
## 234 38 39.75667     -1.7566667          3.08587778
## 235 48 39.75667      8.2433333         67.95254444
## 236 55 39.75667     15.2433333        232.35921111
## 237 52 39.75667     12.2433333        149.89921111
## 238 60 39.75667     20.2433333        409.79254444
## 239 37 39.75667     -2.7566667          7.59921111
## 240 42 39.75667      2.2433333          5.03254444
## 241 46 39.75667      6.2433333         38.97921111
## 242 47 39.75667      7.2433333         52.46587778
## 243 45 39.75667      5.2433333         27.49254444
## 244 26 39.75667    -13.7566667        189.24587778
## 245 41 39.75667      1.2433333          1.54587778
## 246 49 39.75667      9.2433333         85.43921111
## 247 19 39.75667    -20.7566667        430.83921111
## 248 44 39.75667      4.2433333         18.00587778
## 249 19 39.75667    -20.7566667        430.83921111
## 250 53 39.75667     13.2433333        175.38587778
## 251 35 39.75667     -4.7566667         22.62587778
## 252 38 39.75667     -1.7566667          3.08587778
## 253 25 39.75667    -14.7566667        217.75921111
## 254 23 39.75667    -16.7566667        280.78587778
## 255 48 39.75667      8.2433333         67.95254444
## 256 37 39.75667     -2.7566667          7.59921111
## 257 43 39.75667      3.2433333         10.51921111
## 258 24 39.75667    -15.7566667        248.27254444
## 259 29 39.75667    -10.7566667        115.70587778
## 260 50 39.75667     10.2433333        104.92587778
## 261 29 39.75667    -10.7566667        115.70587778
## 262 35 39.75667     -4.7566667         22.62587778
## 263 42 39.75667      2.2433333          5.03254444
## 264 26 39.75667    -13.7566667        189.24587778
## 265 29 39.75667    -10.7566667        115.70587778
## 266 40 39.75667      0.2433333          0.05921111
## 267 36 39.75667     -3.7566667         14.11254444
## 268 38 39.75667     -1.7566667          3.08587778
## 269 38 39.75667     -1.7566667          3.08587778
## 270 21 39.75667    -18.7566667        351.81254444
## 271 56 39.75667     16.2433333        263.84587778
## 272 33 39.75667     -6.7566667         45.65254444
## 273 19 39.75667    -20.7566667        430.83921111
## 274 44 39.75667      4.2433333         18.00587778
## 275 21 39.75667    -18.7566667        351.81254444
## 276 49 39.75667      9.2433333         85.43921111
## 277 18 39.75667    -21.7566667        473.35254444
## 278 23 39.75667    -16.7566667        280.78587778
## 279 53 39.75667     13.2433333        175.38587778
## 280 39 39.75667     -0.7566667          0.57254444
## 281 59 39.75667     19.2433333        370.30587778
## 282 43 39.75667      3.2433333         10.51921111
## 283 33 39.75667     -6.7566667         45.65254444
## 284 44 39.75667      4.2433333         18.00587778
## 285 24 39.75667    -15.7566667        248.27254444
## 286 38 39.75667     -1.7566667          3.08587778
## 287 51 39.75667     11.2433333        126.41254444
## 288 48 39.75667      8.2433333         67.95254444
## 289 18 39.75667    -21.7566667        473.35254444
## 290 46 39.75667      6.2433333         38.97921111
## 291 43 39.75667      3.2433333         10.51921111
## 292 22 39.75667    -17.7566667        315.29921111
## 293 54 39.75667     14.2433333        202.87254444
## 294 20 39.75667    -19.7566667        390.32587778
## 295 54 39.75667     14.2433333        202.87254444
## 296 41 39.75667      1.2433333          1.54587778
## 297 56 39.75667     16.2433333        263.84587778
## 298 52 39.75667     12.2433333        149.89921111
## 299 36 39.75667     -3.7566667         14.11254444
## 300 32 39.75667     -7.7566667         60.16587778

Calculando la suma y determinando varianza

n <- length(edades1)
suma <- sum(tabla.varianza.edades1$xi.menos.media.cuad)
suma
## [1] 48359.24
varianza <- suma / (n -1)
varianza
## [1] 161.7366

Con las funciones de var() y sd() se determinan la varianza y a desviación respectivamente y con mean() la media de la muestra.

varianza_edades1 <- var(edades1)
varianza_edades2 <- var(edades2)
desv.std_edades1 <- sd(edades1)
desv.std_edades2 <- sd(edades2)

Se muestran los valores generados, el punto y coma en R significa en una misma linea se ejecutan dos instrucciones o dos comandos, en este caso solo mostrar los valores.

varianza_edades1; varianza_edades2
## [1] 161.7366
## [1] 26.94505
desv.std_edades1; desv.std_edades2 
## [1] 12.71757
## [1] 5.190862

4.3.3 Coeficiente de variación

El coeficiente de variación (CV) es un estadístico que permite comparar entre dos o mas conjuntos de datos cuál es estos tiene una dispersión mayor o menor.

Al identificar el CV de un conjunto de datos y compararlo con otro CV de otro conjunto de datos similares, se puede determinar cual de los datos tiene mayor o menor dispersión y se puede concluir en cual es estos está mas dispersos sus datos, es decir cuál de ellos se aleja mas o menos de la media, según sea el caso.

Para determinar el coeficiente de variación se establece la división de la desviación estándar entre la media del conjunto de datos.

\[ CV = \frac{\sigma}{\bar{x}} \]

CV_edades1 <- desv.std_edades1 / media_edades1
CV_edades1
## [1] 0.3198852
CV_edades2 <- desv.std_edades2 / media_edades2
CV_edades2
## [1] 0.1725112

5 Interpretación

¿Qué representan las tablas de frecuencias para los datos edades?

En la tabla de frecuencias podemos ver la clases y las frecuencias de estas, así como los valores relativos y porcentuales.

En edades1 podemos observar que un 12.33% de los datos se encuentran en el rango de 34.93 y 39.21

En relación a edades2 existe una cantidad de valores entre 27.09 y 30.15 que representan el 23.67%.

¿Cuáles son los valores media y desviación de los conjuntos de datos edades?

Con nuestro conjunto de datos edades1 podemos encontrar media de 39.75 y una desviación de: 12.71

Con respecto a los valores estadísticos del conjunto de datos edades2, el valor la media es de: 30.09, la desviación es de: 5.19.

¿Cuáles son los valores de coeficiente de variación para los conjuntos de datos edades y que representan?

El coeficiente de variación de edades1 es de: 0.3198852y el CV de edades2 es de: 0.1725112

Podemos observas que existe una mayor dispersion en el conjunto edades 1 que en el conjunto edades 2

6 Bibliografía

Anderson, David R., Dennis J. Sweeney, and Thomas A. Williams. 2008. Estadística Para Administración y Economía. 10th ed. Australia Brasil Corea España Estados Unidos Japón México Reino Unido Singapur: Cengage Learning,.

Devore, Jay L. 2016b. Fundamentos de Probabilidad y Estadística. Primera Edición. CENGAGE.

———. 2016a. Fundamentos de Probabilidad y Estadística. Primera Edición. CENGAGE.