1 Objetivo

Determinar medidas de dispersión de datos como edades, sueldos y calificaciones.

2 Descripción

  • Simular muestra de varios conjuntos de datos

  • Se identifica media de los datos

  • Se muestran tablas de frecuencias

  • Se calculan medidas de dispersión, varianza y desviación estándar.

  • Se visualiza la dispersión de los datos en relación a la media.

  • Se calcula el coeficiente de variación y se compara con similares conjuntos de datos.

3 Marco teórico

¿Para que sirven las medidas de dispersión?

El reporte de una medida de centralización como la media, mediana y moda sólo da información parcial sobre un conjunto o distribución de datos. Diferentes muestras o poblaciones pueden tener medidas idénticas de centro y aun así diferir una de otra en otras importantes maneras. (Devore 2016a).

La imagen siguiente muestra tres conjuntos de datos y los tres tienen media y mediana igual, sin embargo la dispersión es diferentes, es decir cual conjunto de datos se aleja mas de la media.

La primera tiene la cantidad más grande de variabilidad, la tercera tiene la cantidad más pequeña y la segunda es intermedia respecto a las otras dos en este aspecto.

3.1 Varianza

La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está basada en la diferencia entre el valor de cada observación (xixi) y la media x¯x¯ (Anderson, Sweeney, and Williams 2008).

3.1.1 Fórmulas

Se identifican las fórmulas para varianza poblacional y muestral, dependiendo de los datos a analizar, si es todas las observaciones de la población y solo una muestra de la misma.

Para efectos de este ejercicio se utiliza mas específicamente la varianza y desviación muestral.

3.1.1.1 Fórmula de varianza poblacional

\[ \sigma^2 = \frac{\sum_{i=1}^N(x_i- \mu)^2}{N} \] siendo μμ la media poblacional y NN el total de los datos de la población.

Fórmula de varianza muestral

\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \] siendo x¯x¯ la media muestral y nn el total de los datos de la muestra.

Las unidades al cuadrado de la varianza dificultan la comprensión e interpretación intuitiva de los valores numéricos de la varianza.

3.2 Desviación estándar

La desviación estándar se define como la raíz cuadrada positiva de la varianza.

Continuando con la notación adoptada para la varianza muestral y para la varianza poblacional, se emplea ςς para denotar la desviación estándar muestral y σσ para denotar la desviación estándar poblacional.

¿Qué se gana con convertir la varianza en la correspondiente desviación estándar?.

Como la desviación estándar es la raíz cuadrada de la varianza, las unidades de la varianza, son al cuadrado, posiblemente dificulta su interpretación, por tanto, la desviación estándar de se interpreta de mejor manera la variabilidad de los datos porque el valor resultante se mide en las mismas unidades que los datos originales. (Anderson, Sweeney, and Williams 2008).

Una interpretación preliminar de la desviación estándar muestral es que es el tamaño de una desviación típica o representativa de la media muestral dentro de la muestra dada.

3.2.1 Fórmula de desviación estándar poblacional

\[ \sigma = \sqrt{\sigma^2} \]
Fórmula de desviación estándar muestral

\[ S = \sqrt{S^2} \]

3.3 Coeficiente de variación (CV)

En algunas ocasiones se requiere un estadístico descriptivo que indique cuán grande es la desviación estándar en relación con la media. Existe el coeficiente de variación y resuelve ese propósito.

La fórmula del coeficiente de variación indica el grado de dispersión de un conjunto de datos con respecto a la media.

\[ CV = \left(\frac{\sigma}{\bar{x}} \times 100 \right) \text{%} \]

4 Desarrollo

4.1 Librerías

Instalar librerías anticipadamente con install.packages(“fdth”)

library(fdth)    # Para tablas de frecuencias
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
library(ggplot2) # Para gráficos

4.2 Datos edades

Se establece valor de semilla para que se generen los mismos datos.

set.seed(2022)

Se generan 400 edades en dos conjuntos de datos diferentes.

edades1 se genera con función de aleatoriedad sample()

edades2 se genera con la función de distribución normal rnorm().

n <- 400

edades1 <- sample(x = 18:60,size = n,replace = TRUE )

4.2.1 edades1

4.2.1.1 Mostrar los datos edades1

Se identifican los datos edades1

edades1
##   [1] 53 31 28 21 23 31 45 58 31 24 46 39 22 18 49 18 51 56 46 29 32 23 56 39 22
##  [26] 28 45 60 37 25 20 21 46 19 51 25 59 56 50 48 36 18 36 58 58 20 49 27 50 52
##  [51] 43 37 43 33 40 48 22 33 59 19 41 41 34 29 32 35 22 23 50 59 40 57 57 43 46
##  [76] 32 50 48 29 40 28 26 52 52 37 52 49 55 33 19 25 34 45 33 32 50 46 25 34 26
## [101] 56 19 36 46 20 21 53 55 22 18 37 43 30 43 39 51 18 33 59 21 30 20 59 18 45
## [126] 49 24 21 58 30 22 59 48 40 32 59 36 18 31 28 57 55 28 35 19 28 31 52 20 58
## [151] 22 23 22 35 37 43 51 36 54 36 20 31 20 34 36 18 44 31 49 25 49 56 32 19 55
## [176] 55 26 59 48 40 28 47 35 27 44 32 21 30 38 44 37 33 23 50 53 57 31 34 47 58
## [201] 30 55 27 45 33 33 52 54 43 27 20 19 18 40 46 31 48 33 45 46 60 52 54 53 59
## [226] 31 35 24 37 59 50 25 56 27 59 48 42 56 26 25 23 18 56 35 49 49 41 23 42 33
## [251] 56 25 20 38 33 56 59 56 60 45 48 48 38 25 31 54 30 33 21 19 57 37 18 43 34
## [276] 20 19 47 33 41 60 52 35 60 38 58 28 58 34 59 39 57 26 48 26 36 26 33 45 52
## [301] 57 47 54 50 32 36 24 23 59 23 58 28 52 37 27 33 35 47 58 48 21 35 25 56 40
## [326] 46 34 50 36 26 46 33 18 27 41 25 39 51 35 26 42 36 55 58 34 43 59 31 59 35
## [351] 47 30 42 46 26 19 53 36 50 51 19 50 18 27 21 59 34 31 22 40 23 55 29 22 56
## [376] 32 36 29 32 30 36 60 37 18 49 27 55 55 28 47 27 50 58 29 33 43 31 48 51 45

4.2.1.2 Tablas de frecuencias edades1

Se muestran las tablas de frecuencias del conjunto de datos edades1.

En las tablas de frecuencias se determina matemáticamente el número de clases, La opción matemáticamente más consistente es la conocida como regla de Sturges.

La solución de esta ecuación proporciona una regla práctica para obtener el número de clases.

\[ k=1+3.322*log10(n) \]

  • Siendo k el número de clases

  • log es la función logarítmica de base 10, log10()

  • y n el total de la muestra

El rango de clase de acuerdo a Sturges está dada por:

\[ h=\frac{max(datos) - min(datos)}{k} \]

Siendo h el rango de cada clase y max(datos) - min(datos) el rango del total de los datos, es decir la diferencia entre límite superior menos límite inferior.

Existen otras formas de determinar el número de clases a utilizar, algunas más complejas, otras más simples.

Independientemente de la forma de cálculo seleccionada ya se Sturges, Scott o Freedman-Diaconis (FD), lo realmente importante es que la información mostrada en la tabla de frecuencia sea fácil de revisar, que no contenga un número excesivo de clases y que la información que en ella se refleja permita comprender cómo se presentan los datos en la población o de una muestra.

El número de clase de acuerdo par n=200n=200 de acuerdo a Sturges es:

k  <- round(1+3.322 * log10(n))
k
## [1] 10

La amplitud h1 y h2 para cada conjunto de datos es igual a:

h = diff(range(edades1)) / k
h
## [1] 4.2
tabla.edades1 <- fdt(x = edades1, breaks="Sturges")
tabla.edades1
##   Class limits  f   rf rf(%)  cf  cf(%)
##   [17.82,22.1) 54 0.14 13.50  54  13.50
##   [22.1,26.38) 35 0.09  8.75  89  22.25
##  [26.38,30.65) 34 0.09  8.50 123  30.75
##  [30.65,34.93) 51 0.13 12.75 174  43.50
##  [34.93,39.21) 44 0.11 11.00 218  54.50
##  [39.21,43.49) 27 0.07  6.75 245  61.25
##  [43.49,47.77) 30 0.07  7.50 275  68.75
##  [47.77,52.04) 50 0.12 12.50 325  81.25
##  [52.04,56.32) 33 0.08  8.25 358  89.50
##   [56.32,60.6) 42 0.10 10.50 400 100.00
  • Class limits significa el rango de cada clase

  • f significa la frecuencia, la suma de f debe ser el total de elementos.

  • rf significa frecuencia relativa la suma de todas las rf debe ser el 1

  • rf% significa el valor relativo pero en porcentaje, la suma de rf% debe ser el 100%

  • cf significa frecuencia acumulada

  • cf% significa frecuencia porcentual acumulada

4.2.1.3 Histograma de edades1

hist(edades1, breaks = "Sturges" ) 

4.2.1.4 Dispersión de edades1

datos.edades1 <- data.frame(x = 1:length(edades1), edad= edades1)
ggplot(datos.edades1, aes(x=x, y=edad))+
  geom_point() +
  geom_hline(yintercept = mean(edades1), col='red') +
  ggtitle(label = "Dispersión de edades1", subtitle = paste("media = ", mean(edades1)))

4.2.1.5 edades2

4.2.1.6 Crear y mostrrar los datos edades2

edades2 <- round(rnorm(n = n, mean = 30, sd = 5))

4.2.1.7 Se identifican los datos edades2

sort(edades2)
##   [1] 13 15 16 18 19 19 19 19 20 20 20 20 21 21 21 22 22 22 23 23 23 23 23 23 23
##  [26] 23 23 23 23 23 23 24 24 24 24 24 24 24 24 24 25 25 25 25 25 25 25 25 25 25
##  [51] 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 26 26 26 26 26 26 26
##  [76] 26 26 26 26 26 26 26 26 26 26 26 26 26 26 27 27 27 27 27 27 27 27 27 27 27
## [101] 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 28 28 28 28
## [126] 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28
## [151] 28 28 28 28 28 28 28 28 28 28 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29
## [176] 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29
## [201] 29 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30
## [226] 30 30 30 30 30 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31
## [251] 31 31 31 31 31 31 31 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32
## [276] 32 32 32 32 32 32 32 32 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33
## [301] 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 34 34 34 34 34 34 34
## [326] 34 34 34 34 34 34 34 34 34 34 35 35 35 35 35 35 35 35 35 35 35 35 35 35 36
## [351] 36 36 36 36 36 36 36 36 36 36 36 36 36 36 36 36 37 37 37 37 37 37 37 37 37
## [376] 37 37 38 38 38 38 38 38 38 39 39 39 39 39 40 40 40 40 40 41 41 42 43 44 49

4.2.1.8 Tablas de frecuencias edades2

Se muestran las tablas de frecuencias del conjunto de datos edades2.

4.2.1.9 Histograma de edades2

hist(edades2, breaks = "Sturges" ) 

4.2.1.10 Dispersión de edades2

datos.edades2 <- data.frame(x = 1:length(edades2), edad= edades2)
ggplot(datos.edades2, aes(x=x, y=edad))+
  geom_point() +
  geom_hline(yintercept = mean(edades2), col='red') +
  ggtitle(label = "Dispersión de edades2", subtitle = paste("media = ", mean(edades2)))

4.2.1.11 Medidas de dispersión

Las medidas de dispersión varianza y desviación estándar miden el valor de dispersión de un conjunto de datos numéricos.

La dispersión significa que tanto los datos están alejados de la media, el valor de la desviación se compara con la media y se interpreta que tanto los valores distan del valor de la media.

4.2.2 Medias aritméticas de edades

media_edades1 <- mean(edades1)
media_edades2 <- mean(edades2)

media_edades1; media_edades2 
## [1] 38.54
## [1] 29.8875

4.2.3 Varianza y desviación estándar

\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]

\[ S = \sqrt{S^{2}} \]

tabla.varianza.edades1 <- data.frame(x = edades1,
  x_media = media_edades1,
  xi.menos.media = edades1 - media_edades1,
  xi.menos.media.cuad = (edades1 - media_edades1)^2)

tabla.varianza.edades1
##      x x_media xi.menos.media xi.menos.media.cuad
## 1   53   38.54          14.46            209.0916
## 2   31   38.54          -7.54             56.8516
## 3   28   38.54         -10.54            111.0916
## 4   21   38.54         -17.54            307.6516
## 5   23   38.54         -15.54            241.4916
## 6   31   38.54          -7.54             56.8516
## 7   45   38.54           6.46             41.7316
## 8   58   38.54          19.46            378.6916
## 9   31   38.54          -7.54             56.8516
## 10  24   38.54         -14.54            211.4116
## 11  46   38.54           7.46             55.6516
## 12  39   38.54           0.46              0.2116
## 13  22   38.54         -16.54            273.5716
## 14  18   38.54         -20.54            421.8916
## 15  49   38.54          10.46            109.4116
## 16  18   38.54         -20.54            421.8916
## 17  51   38.54          12.46            155.2516
## 18  56   38.54          17.46            304.8516
## 19  46   38.54           7.46             55.6516
## 20  29   38.54          -9.54             91.0116
## 21  32   38.54          -6.54             42.7716
## 22  23   38.54         -15.54            241.4916
## 23  56   38.54          17.46            304.8516
## 24  39   38.54           0.46              0.2116
## 25  22   38.54         -16.54            273.5716
## 26  28   38.54         -10.54            111.0916
## 27  45   38.54           6.46             41.7316
## 28  60   38.54          21.46            460.5316
## 29  37   38.54          -1.54              2.3716
## 30  25   38.54         -13.54            183.3316
## 31  20   38.54         -18.54            343.7316
## 32  21   38.54         -17.54            307.6516
## 33  46   38.54           7.46             55.6516
## 34  19   38.54         -19.54            381.8116
## 35  51   38.54          12.46            155.2516
## 36  25   38.54         -13.54            183.3316
## 37  59   38.54          20.46            418.6116
## 38  56   38.54          17.46            304.8516
## 39  50   38.54          11.46            131.3316
## 40  48   38.54           9.46             89.4916
## 41  36   38.54          -2.54              6.4516
## 42  18   38.54         -20.54            421.8916
## 43  36   38.54          -2.54              6.4516
## 44  58   38.54          19.46            378.6916
## 45  58   38.54          19.46            378.6916
## 46  20   38.54         -18.54            343.7316
## 47  49   38.54          10.46            109.4116
## 48  27   38.54         -11.54            133.1716
## 49  50   38.54          11.46            131.3316
## 50  52   38.54          13.46            181.1716
## 51  43   38.54           4.46             19.8916
## 52  37   38.54          -1.54              2.3716
## 53  43   38.54           4.46             19.8916
## 54  33   38.54          -5.54             30.6916
## 55  40   38.54           1.46              2.1316
## 56  48   38.54           9.46             89.4916
## 57  22   38.54         -16.54            273.5716
## 58  33   38.54          -5.54             30.6916
## 59  59   38.54          20.46            418.6116
## 60  19   38.54         -19.54            381.8116
## 61  41   38.54           2.46              6.0516
## 62  41   38.54           2.46              6.0516
## 63  34   38.54          -4.54             20.6116
## 64  29   38.54          -9.54             91.0116
## 65  32   38.54          -6.54             42.7716
## 66  35   38.54          -3.54             12.5316
## 67  22   38.54         -16.54            273.5716
## 68  23   38.54         -15.54            241.4916
## 69  50   38.54          11.46            131.3316
## 70  59   38.54          20.46            418.6116
## 71  40   38.54           1.46              2.1316
## 72  57   38.54          18.46            340.7716
## 73  57   38.54          18.46            340.7716
## 74  43   38.54           4.46             19.8916
## 75  46   38.54           7.46             55.6516
## 76  32   38.54          -6.54             42.7716
## 77  50   38.54          11.46            131.3316
## 78  48   38.54           9.46             89.4916
## 79  29   38.54          -9.54             91.0116
## 80  40   38.54           1.46              2.1316
## 81  28   38.54         -10.54            111.0916
## 82  26   38.54         -12.54            157.2516
## 83  52   38.54          13.46            181.1716
## 84  52   38.54          13.46            181.1716
## 85  37   38.54          -1.54              2.3716
## 86  52   38.54          13.46            181.1716
## 87  49   38.54          10.46            109.4116
## 88  55   38.54          16.46            270.9316
## 89  33   38.54          -5.54             30.6916
## 90  19   38.54         -19.54            381.8116
## 91  25   38.54         -13.54            183.3316
## 92  34   38.54          -4.54             20.6116
## 93  45   38.54           6.46             41.7316
## 94  33   38.54          -5.54             30.6916
## 95  32   38.54          -6.54             42.7716
## 96  50   38.54          11.46            131.3316
## 97  46   38.54           7.46             55.6516
## 98  25   38.54         -13.54            183.3316
## 99  34   38.54          -4.54             20.6116
## 100 26   38.54         -12.54            157.2516
## 101 56   38.54          17.46            304.8516
## 102 19   38.54         -19.54            381.8116
## 103 36   38.54          -2.54              6.4516
## 104 46   38.54           7.46             55.6516
## 105 20   38.54         -18.54            343.7316
## 106 21   38.54         -17.54            307.6516
## 107 53   38.54          14.46            209.0916
## 108 55   38.54          16.46            270.9316
## 109 22   38.54         -16.54            273.5716
## 110 18   38.54         -20.54            421.8916
## 111 37   38.54          -1.54              2.3716
## 112 43   38.54           4.46             19.8916
## 113 30   38.54          -8.54             72.9316
## 114 43   38.54           4.46             19.8916
## 115 39   38.54           0.46              0.2116
## 116 51   38.54          12.46            155.2516
## 117 18   38.54         -20.54            421.8916
## 118 33   38.54          -5.54             30.6916
## 119 59   38.54          20.46            418.6116
## 120 21   38.54         -17.54            307.6516
## 121 30   38.54          -8.54             72.9316
## 122 20   38.54         -18.54            343.7316
## 123 59   38.54          20.46            418.6116
## 124 18   38.54         -20.54            421.8916
## 125 45   38.54           6.46             41.7316
## 126 49   38.54          10.46            109.4116
## 127 24   38.54         -14.54            211.4116
## 128 21   38.54         -17.54            307.6516
## 129 58   38.54          19.46            378.6916
## 130 30   38.54          -8.54             72.9316
## 131 22   38.54         -16.54            273.5716
## 132 59   38.54          20.46            418.6116
## 133 48   38.54           9.46             89.4916
## 134 40   38.54           1.46              2.1316
## 135 32   38.54          -6.54             42.7716
## 136 59   38.54          20.46            418.6116
## 137 36   38.54          -2.54              6.4516
## 138 18   38.54         -20.54            421.8916
## 139 31   38.54          -7.54             56.8516
## 140 28   38.54         -10.54            111.0916
## 141 57   38.54          18.46            340.7716
## 142 55   38.54          16.46            270.9316
## 143 28   38.54         -10.54            111.0916
## 144 35   38.54          -3.54             12.5316
## 145 19   38.54         -19.54            381.8116
## 146 28   38.54         -10.54            111.0916
## 147 31   38.54          -7.54             56.8516
## 148 52   38.54          13.46            181.1716
## 149 20   38.54         -18.54            343.7316
## 150 58   38.54          19.46            378.6916
## 151 22   38.54         -16.54            273.5716
## 152 23   38.54         -15.54            241.4916
## 153 22   38.54         -16.54            273.5716
## 154 35   38.54          -3.54             12.5316
## 155 37   38.54          -1.54              2.3716
## 156 43   38.54           4.46             19.8916
## 157 51   38.54          12.46            155.2516
## 158 36   38.54          -2.54              6.4516
## 159 54   38.54          15.46            239.0116
## 160 36   38.54          -2.54              6.4516
## 161 20   38.54         -18.54            343.7316
## 162 31   38.54          -7.54             56.8516
## 163 20   38.54         -18.54            343.7316
## 164 34   38.54          -4.54             20.6116
## 165 36   38.54          -2.54              6.4516
## 166 18   38.54         -20.54            421.8916
## 167 44   38.54           5.46             29.8116
## 168 31   38.54          -7.54             56.8516
## 169 49   38.54          10.46            109.4116
## 170 25   38.54         -13.54            183.3316
## 171 49   38.54          10.46            109.4116
## 172 56   38.54          17.46            304.8516
## 173 32   38.54          -6.54             42.7716
## 174 19   38.54         -19.54            381.8116
## 175 55   38.54          16.46            270.9316
## 176 55   38.54          16.46            270.9316
## 177 26   38.54         -12.54            157.2516
## 178 59   38.54          20.46            418.6116
## 179 48   38.54           9.46             89.4916
## 180 40   38.54           1.46              2.1316
## 181 28   38.54         -10.54            111.0916
## 182 47   38.54           8.46             71.5716
## 183 35   38.54          -3.54             12.5316
## 184 27   38.54         -11.54            133.1716
## 185 44   38.54           5.46             29.8116
## 186 32   38.54          -6.54             42.7716
## 187 21   38.54         -17.54            307.6516
## 188 30   38.54          -8.54             72.9316
## 189 38   38.54          -0.54              0.2916
## 190 44   38.54           5.46             29.8116
## 191 37   38.54          -1.54              2.3716
## 192 33   38.54          -5.54             30.6916
## 193 23   38.54         -15.54            241.4916
## 194 50   38.54          11.46            131.3316
## 195 53   38.54          14.46            209.0916
## 196 57   38.54          18.46            340.7716
## 197 31   38.54          -7.54             56.8516
## 198 34   38.54          -4.54             20.6116
## 199 47   38.54           8.46             71.5716
## 200 58   38.54          19.46            378.6916
## 201 30   38.54          -8.54             72.9316
## 202 55   38.54          16.46            270.9316
## 203 27   38.54         -11.54            133.1716
## 204 45   38.54           6.46             41.7316
## 205 33   38.54          -5.54             30.6916
## 206 33   38.54          -5.54             30.6916
## 207 52   38.54          13.46            181.1716
## 208 54   38.54          15.46            239.0116
## 209 43   38.54           4.46             19.8916
## 210 27   38.54         -11.54            133.1716
## 211 20   38.54         -18.54            343.7316
## 212 19   38.54         -19.54            381.8116
## 213 18   38.54         -20.54            421.8916
## 214 40   38.54           1.46              2.1316
## 215 46   38.54           7.46             55.6516
## 216 31   38.54          -7.54             56.8516
## 217 48   38.54           9.46             89.4916
## 218 33   38.54          -5.54             30.6916
## 219 45   38.54           6.46             41.7316
## 220 46   38.54           7.46             55.6516
## 221 60   38.54          21.46            460.5316
## 222 52   38.54          13.46            181.1716
## 223 54   38.54          15.46            239.0116
## 224 53   38.54          14.46            209.0916
## 225 59   38.54          20.46            418.6116
## 226 31   38.54          -7.54             56.8516
## 227 35   38.54          -3.54             12.5316
## 228 24   38.54         -14.54            211.4116
## 229 37   38.54          -1.54              2.3716
## 230 59   38.54          20.46            418.6116
## 231 50   38.54          11.46            131.3316
## 232 25   38.54         -13.54            183.3316
## 233 56   38.54          17.46            304.8516
## 234 27   38.54         -11.54            133.1716
## 235 59   38.54          20.46            418.6116
## 236 48   38.54           9.46             89.4916
## 237 42   38.54           3.46             11.9716
## 238 56   38.54          17.46            304.8516
## 239 26   38.54         -12.54            157.2516
## 240 25   38.54         -13.54            183.3316
## 241 23   38.54         -15.54            241.4916
## 242 18   38.54         -20.54            421.8916
## 243 56   38.54          17.46            304.8516
## 244 35   38.54          -3.54             12.5316
## 245 49   38.54          10.46            109.4116
## 246 49   38.54          10.46            109.4116
## 247 41   38.54           2.46              6.0516
## 248 23   38.54         -15.54            241.4916
## 249 42   38.54           3.46             11.9716
## 250 33   38.54          -5.54             30.6916
## 251 56   38.54          17.46            304.8516
## 252 25   38.54         -13.54            183.3316
## 253 20   38.54         -18.54            343.7316
## 254 38   38.54          -0.54              0.2916
## 255 33   38.54          -5.54             30.6916
## 256 56   38.54          17.46            304.8516
## 257 59   38.54          20.46            418.6116
## 258 56   38.54          17.46            304.8516
## 259 60   38.54          21.46            460.5316
## 260 45   38.54           6.46             41.7316
## 261 48   38.54           9.46             89.4916
## 262 48   38.54           9.46             89.4916
## 263 38   38.54          -0.54              0.2916
## 264 25   38.54         -13.54            183.3316
## 265 31   38.54          -7.54             56.8516
## 266 54   38.54          15.46            239.0116
## 267 30   38.54          -8.54             72.9316
## 268 33   38.54          -5.54             30.6916
## 269 21   38.54         -17.54            307.6516
## 270 19   38.54         -19.54            381.8116
## 271 57   38.54          18.46            340.7716
## 272 37   38.54          -1.54              2.3716
## 273 18   38.54         -20.54            421.8916
## 274 43   38.54           4.46             19.8916
## 275 34   38.54          -4.54             20.6116
## 276 20   38.54         -18.54            343.7316
## 277 19   38.54         -19.54            381.8116
## 278 47   38.54           8.46             71.5716
## 279 33   38.54          -5.54             30.6916
## 280 41   38.54           2.46              6.0516
## 281 60   38.54          21.46            460.5316
## 282 52   38.54          13.46            181.1716
## 283 35   38.54          -3.54             12.5316
## 284 60   38.54          21.46            460.5316
## 285 38   38.54          -0.54              0.2916
## 286 58   38.54          19.46            378.6916
## 287 28   38.54         -10.54            111.0916
## 288 58   38.54          19.46            378.6916
## 289 34   38.54          -4.54             20.6116
## 290 59   38.54          20.46            418.6116
## 291 39   38.54           0.46              0.2116
## 292 57   38.54          18.46            340.7716
## 293 26   38.54         -12.54            157.2516
## 294 48   38.54           9.46             89.4916
## 295 26   38.54         -12.54            157.2516
## 296 36   38.54          -2.54              6.4516
## 297 26   38.54         -12.54            157.2516
## 298 33   38.54          -5.54             30.6916
## 299 45   38.54           6.46             41.7316
## 300 52   38.54          13.46            181.1716
## 301 57   38.54          18.46            340.7716
## 302 47   38.54           8.46             71.5716
## 303 54   38.54          15.46            239.0116
## 304 50   38.54          11.46            131.3316
## 305 32   38.54          -6.54             42.7716
## 306 36   38.54          -2.54              6.4516
## 307 24   38.54         -14.54            211.4116
## 308 23   38.54         -15.54            241.4916
## 309 59   38.54          20.46            418.6116
## 310 23   38.54         -15.54            241.4916
## 311 58   38.54          19.46            378.6916
## 312 28   38.54         -10.54            111.0916
## 313 52   38.54          13.46            181.1716
## 314 37   38.54          -1.54              2.3716
## 315 27   38.54         -11.54            133.1716
## 316 33   38.54          -5.54             30.6916
## 317 35   38.54          -3.54             12.5316
## 318 47   38.54           8.46             71.5716
## 319 58   38.54          19.46            378.6916
## 320 48   38.54           9.46             89.4916
## 321 21   38.54         -17.54            307.6516
## 322 35   38.54          -3.54             12.5316
## 323 25   38.54         -13.54            183.3316
## 324 56   38.54          17.46            304.8516
## 325 40   38.54           1.46              2.1316
## 326 46   38.54           7.46             55.6516
## 327 34   38.54          -4.54             20.6116
## 328 50   38.54          11.46            131.3316
## 329 36   38.54          -2.54              6.4516
## 330 26   38.54         -12.54            157.2516
## 331 46   38.54           7.46             55.6516
## 332 33   38.54          -5.54             30.6916
## 333 18   38.54         -20.54            421.8916
## 334 27   38.54         -11.54            133.1716
## 335 41   38.54           2.46              6.0516
## 336 25   38.54         -13.54            183.3316
## 337 39   38.54           0.46              0.2116
## 338 51   38.54          12.46            155.2516
## 339 35   38.54          -3.54             12.5316
## 340 26   38.54         -12.54            157.2516
## 341 42   38.54           3.46             11.9716
## 342 36   38.54          -2.54              6.4516
## 343 55   38.54          16.46            270.9316
## 344 58   38.54          19.46            378.6916
## 345 34   38.54          -4.54             20.6116
## 346 43   38.54           4.46             19.8916
## 347 59   38.54          20.46            418.6116
## 348 31   38.54          -7.54             56.8516
## 349 59   38.54          20.46            418.6116
## 350 35   38.54          -3.54             12.5316
## 351 47   38.54           8.46             71.5716
## 352 30   38.54          -8.54             72.9316
## 353 42   38.54           3.46             11.9716
## 354 46   38.54           7.46             55.6516
## 355 26   38.54         -12.54            157.2516
## 356 19   38.54         -19.54            381.8116
## 357 53   38.54          14.46            209.0916
## 358 36   38.54          -2.54              6.4516
## 359 50   38.54          11.46            131.3316
## 360 51   38.54          12.46            155.2516
## 361 19   38.54         -19.54            381.8116
## 362 50   38.54          11.46            131.3316
## 363 18   38.54         -20.54            421.8916
## 364 27   38.54         -11.54            133.1716
## 365 21   38.54         -17.54            307.6516
## 366 59   38.54          20.46            418.6116
## 367 34   38.54          -4.54             20.6116
## 368 31   38.54          -7.54             56.8516
## 369 22   38.54         -16.54            273.5716
## 370 40   38.54           1.46              2.1316
## 371 23   38.54         -15.54            241.4916
## 372 55   38.54          16.46            270.9316
## 373 29   38.54          -9.54             91.0116
## 374 22   38.54         -16.54            273.5716
## 375 56   38.54          17.46            304.8516
## 376 32   38.54          -6.54             42.7716
## 377 36   38.54          -2.54              6.4516
## 378 29   38.54          -9.54             91.0116
## 379 32   38.54          -6.54             42.7716
## 380 30   38.54          -8.54             72.9316
## 381 36   38.54          -2.54              6.4516
## 382 60   38.54          21.46            460.5316
## 383 37   38.54          -1.54              2.3716
## 384 18   38.54         -20.54            421.8916
## 385 49   38.54          10.46            109.4116
## 386 27   38.54         -11.54            133.1716
## 387 55   38.54          16.46            270.9316
## 388 55   38.54          16.46            270.9316
## 389 28   38.54         -10.54            111.0916
## 390 47   38.54           8.46             71.5716
## 391 27   38.54         -11.54            133.1716
## 392 50   38.54          11.46            131.3316
## 393 58   38.54          19.46            378.6916
## 394 29   38.54          -9.54             91.0116
## 395 33   38.54          -5.54             30.6916
## 396 43   38.54           4.46             19.8916
## 397 31   38.54          -7.54             56.8516
## 398 48   38.54           9.46             89.4916
## 399 51   38.54          12.46            155.2516
## 400 45   38.54           6.46             41.7316

Calculando la suma y determinando varianza

n <- length(edades1)
suma <- sum(tabla.varianza.edades1$xi.menos.media.cuad)

suma
## [1] 65803.36
varianza <- suma / (n -1)
varianza
## [1] 164.9207

Con las funciones de var() y sd() se determinan la varianza y a desviación respectivamente y con mean() la media de la muestra.

varianza_edades1 <- var(edades1)
varianza_edades2 <- var(edades2)

desv.std_edades1 <- sd(edades1)
desv.std_edades2 <- sd(edades2)

Se muestran los valores generados, el punto y coma en R significa en una misma linea se ejecutan dos instrucciones o dos comandos, en este caso solo mostrar los valores.

varianza_edades1; varianza_edades2
## [1] 164.9207
## [1] 23.39333
desv.std_edades1; desv.std_edades2 
## [1] 12.84215
## [1] 4.836665

4.2.4 Coeficiente de variación

El coeficiente de variación (CV) es un estadístico que permite comparar entre dos o mas conjuntos de datos cuál es estos tiene una dispersión mayor o menor.

Al identificar el CV de un conjunto de datos y compararlo con otro CV de otro conjunto de datos similares, se puede determinar cual de los datos tiene mayor o menor dispersión y se puede concluir en cual es estos está mas dispersos sus datos, es decir cuál de ellos se aleja mas o menos de la media, según sea el caso.

Para determinar el coeficiente de variación se establece la división de la desviación estándar entre la media del conjunto de datos.

\[ CV = \frac{\sigma}{\bar{x}} \]

CV_edades1 <- desv.std_edades1 / media_edades1
CV_edades1
## [1] 0.333216
CV_edades2 <- desv.std_edades2 / media_edades2
CV_edades2
## [1] 0.161829

5 Interpretación

¿Qué representan las tablas de frecuencias para los datos edades?

Las tablas de frecuencia representan las clases y la frecuencias de casos de cada una de las clases, permiten observar los valores relativos y porcentuales de las frecuencias.

Con respecto a edades1 existe un 15.5% de valores que están en un rango o intervalo entre 36.83 y 41.59.

En relación a edades2 existe una cantidad de valores entre 36.83 y 46.34 que representan el 14.5%.

¿Cuáles son los valores media y desviación de los conjuntos de datos edades?

Con respecto a los valores estadísticos del conjunto de datos edades1, el valor la media es de: 38.61, la desviación es de: 12.5216556.

Con respecto a los valores estadísticos del conjunto de datos edades2, el valor la media es de: 29.605, la desviación es de: 5.1820113.

¿Cuáles son los valores de coeficiente de variación para los conjuntos de datos edades y que representan?

El coeficiente de variación de edades1 es de: 0.3243112y el CV de edades2 es de: 0.1750384

Existe mayor dispersión en los valores del conjunto de datos edades1 con respecto a edades2 por tener ligeramente mayor valor en su coeficiente de variación.

Has una breve Explicación sobre el caso:

En el caso número 4 se pide la Varianza, la desviación y el coeficiente de variación de un rango de 400 edades entre 18 y 60 años.

¿Cuántos grupos de edades se piden en el caso?

En este caso se pide la edad de 400 personas en 2 conjuntos que serán llamados edades1 y edades2.

¿Cuál es la Media aritmética del conjunto de edades1?

La media aritmética de este conjunto es de 40.37.

¿Cuál es la media aritmética de conjunto edades2?

La media aritmética obtenida del conjunto edades2 es de 30.2525.

¿Cuál es la varianza de este caso?

La varianza obtenida de este caso es de 164.920701.

Menciona las varianzas obtenidas de los conjuntos edades1 y edades2.

Las Varianzas de los 2 conjuntos son de:

Edades1. 164.902701754386

Edades2. 23.3933270676692

Menciona la Desviación de los 2 conjuntos.

Las Desviaciones obtenidas en este caso son de:

Edades1. 12.84214

Edades2. 4.836664

Menciona el Coeficiente de Variación de los 2 Conjuntos:

Los Coeficientes de Variación obtenidos del caso son:

Edades1. 0.333216

Edades2. 0.161829