Determinar medidas de dispersión de datos como edades, sueldos y calificaciones.
Simular muestra de varios conjuntos de datos
Se identifica media de los datos
Se muestran tablas de frecuencias
Se calculan medidas de dispersión, varianza y desviación estándar.
Se visualiza la dispersión de los datos en relación a la media.
Se calcula el coeficiente de variación y se compara con similares conjuntos de datos.
¿Para que sirven las medidas de dispersión?
El reporte de una medida de centralización como la media, mediana y moda sólo da información parcial sobre un conjunto o distribución de datos. Diferentes muestras o poblaciones pueden tener medidas idénticas de centro y aun así diferir una de otra en otras importantes maneras. [@devore2016a].
La imagen siguiente muestra tres conjuntos de datos y los tres tienen media y mediana igual, sin embargo la dispersión es diferentes, es decir cual conjunto de datos se aleja mas de la media.
La primera tiene la cantidad más grande de variabilidad, la tercera tiene la cantidad más pequeña y la segunda es intermedia respecto a las otras dos en este aspecto. [@devore2016].
La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está basada en la diferencia entre el valor de cada observación (\(x_i\)) y la media \(\bar{x}\) [@anderson2008].
Se identifican las fórmulas para varianza poblacional y muestral, dependiendo de los datos a analizar, si es todas las observaciones de la población y solo una muestra de la misma.
Para efectos de este ejercicio se utiliza mas específicamente la varianza y desviación muestral.
\[ \sigma^2 = \frac{\sum_{i=1}^N(x_i- \mu)^2}{N} \]
siendo \(\mu\) la media poblacional y \(N\) el total de los datos de la población.
\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]
siendo \(\bar{x}\) la media muestral y \(n\) el total de los datos de la muestra.
Las unidades al cuadrado de la varianza dificultan la comprensión e interpretación intuitiva de los valores numéricos de la varianza.
La desviación estándar se define como la raíz cuadrada positiva de la varianza.
Continuando con la notación adoptada para la varianza muestral y para la varianza poblacional, se emplea \(\varsigma\) para denotar la desviación estándar muestral y \(\sigma\) para denotar la desviación estándar poblacional.
¿Qué se gana con convertir la varianza en la correspondiente desviación estándar?.
Como la desviación estándar es la raíz cuadrada de la varianza, las unidades de la varianza, son al cuadrado, posiblemente dificulta su interpretación, por tanto, la desviación estándar de se interpreta de mejor manera la variabilidad de los datos porque el valor resultante se mide en las mismas unidades que los datos originales. [@anderson2008].
Una interpretación preliminar de la desviación estándar muestral es que es el tamaño de una desviación típica o representativa de la media muestral dentro de la muestra dada.[@devore2016]
\[ \sigma = \sqrt{\sigma^2} \]
\[ S = \sqrt{S^2} \]
En algunas ocasiones se requiere un estadístico descriptivo que indique cuán grande es la desviación estándar en relación con la media. Existe el coeficiente de variación y resuelve ese propósito.
La fórmula del coeficiente de variación indica el grado de dispersión de un conjunto de datos con respecto a la media.
\[ CV = \left(\frac{\sigma}{\bar{x}} \times 100 \right) \text{%} \]
Instalar librerías anticipadamente con install.packages(“fdth”)
library(fdth) # Para tablas de frecuencias
library(ggplot2) # Para gráficos
Se establece valor de semilla para que se generen los mismos datos.
set.seed(21041266)
Se generan 300 edades en dos conjuntos de datos diferentes.
edades1 se genera con función de aleatoriedad sample()
edades2 se genera con la función de distribución normal rnorm().
n <- 300
edades1 <- sample(x = 18:60,size = n,replace = TRUE )
Se identifican los datos edades1
edades1
## [1] 20 41 40 31 55 46 26 34 59 59 50 31 35 26 49 21 34 60 46 49 27 43 20 54 19
## [26] 26 38 48 24 53 30 22 44 32 33 26 41 23 44 21 21 19 58 38 52 45 19 31 51 59
## [51] 28 54 32 51 41 21 27 35 43 57 36 22 22 20 23 19 26 42 43 40 60 40 18 30 35
## [76] 44 30 58 19 54 33 30 38 20 57 26 52 28 26 58 45 36 31 37 29 32 25 30 42 41
## [101] 20 21 26 32 37 21 18 51 51 40 56 20 42 36 52 53 26 39 54 42 31 39 36 33 26
## [126] 34 48 60 18 42 52 49 28 40 49 42 44 50 34 41 38 54 20 51 38 43 34 34 35 50
## [151] 32 42 32 54 42 36 24 28 51 43 42 42 45 20 54 50 24 31 42 56 42 18 30 53 36
## [176] 33 51 33 22 34 30 60 55 55 58 24 24 22 19 18 58 42 43 50 31 52 60 22 46 18
## [201] 21 25 46 24 38 24 45 59 24 40 29 50 44 46 55 43 34 42 59 35 21 36 24 57 31
## [226] 45 45 56 45 43 38 28 21 41 53 42 22 51 51 57 57 39 23 59 24 58 25 33 47 20
## [251] 22 27 22 20 52 24 42 26 50 57 36 49 33 38 21 21 49 28 51 37 42 44 26 25 52
## [276] 22 24 31 38 45 50 20 26 32 60 25 56 56 51 34 28 23 42 38 55 38 33 33 45 26
Se muestran las tablas de frecuencias del conjunto de datos edades1.
En las tablas de frecuencias se determina matemáticamente el número de clases, La opción matemáticamente más consistente es la conocida como regla de Sturges.
La solución de esta ecuación proporciona una regla práctica para obtener el número de clases.
\[ k=1+3.322*log10(n) \]
Siendo k el número de clases
log es la función logarítmica de base 10, log10()
y n el total de la muestra
El rango de clase de acuerdo a Sturges está dada por \[ h=\frac{max(datos) - min(datos)}{k} \]Siendo h el rango de cada clase y max(datos) - min(datos) el rango del total de los datos, es decir la diferencia entre límite superior menos límite inferior.
Existen otras formas de determinar el número de clases a utilizar, algunas más complejas, otras más simples.
Independientemente de la forma de cálculo seleccionada ya se Sturges, Scott o Freedman-Diaconis (FD), lo realmente importante es que la información mostrada en la tabla de frecuencia sea fácil de revisar, que no contenga un número excesivo de clases y que la información que en ella se refleja permita comprender cómo se presentan los datos en la población o de una muestra.
El número de clase de acuerdo par \(n=300\) de acuerdo a Sturges es:
k <- round(1+3.322 * log10(n))
k
## [1] 9
La amplitud h1 y h2 para cada conjunto de datos es igual a:
h = diff(range(edades1)) / k
h
## [1] 4.666667
tabla.edades1 <- fdt(x = edades1, breaks="Sturges")
tabla.edades1
## Class limits f rf rf(%) cf cf(%)
## [17.82,22.1) 44 0.15 14.67 44 14.67
## [22.1,26.38) 35 0.12 11.67 79 26.33
## [26.38,30.65) 19 0.06 6.33 98 32.67
## [30.65,34.93) 34 0.11 11.33 132 44.00
## [34.93,39.21) 30 0.10 10.00 162 54.00
## [39.21,43.49) 38 0.13 12.67 200 66.67
## [43.49,47.77) 21 0.07 7.00 221 73.67
## [47.77,52.04) 34 0.11 11.33 255 85.00
## [52.04,56.32) 21 0.07 7.00 276 92.00
## [56.32,60.6) 24 0.08 8.00 300 100.00
Class limits significa el rango de cada clase
f significa la frecuencia, la suma de f debe ser el total de elementos.
rf significa frecuencia relativa la suma de todas las rf debe ser el 1
rf% significa el valor relativo pero en porcentaje, la suma de rf% debe ser el 100%
cf significa frecuencia acumulada
cf% significa frecuencia porcentual acumulada
hist(edades1, breaks = "Sturges" )
datos.edades1 <- data.frame(x = 1:length(edades1), edad= edades1)
ggplot(datos.edades1, aes(x=x, y=edad))+
geom_point() +
geom_hline(yintercept = mean(edades1), col='red') +
ggtitle(label = "Dispersión de edades1", subtitle = paste("media = ", mean(edades1)))
edades2 <- round(rnorm(n = n, mean = 30, sd = 5))
Se identifican los datos edades2
sort(edades2)
## [1] 16 18 19 20 20 20 20 20 20 20 20 21 21 21 21 21 21 22 22 22 22 22 22 22 22
## [26] 23 23 23 23 23 23 23 23 23 23 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24
## [51] 25 25 25 25 25 25 25 25 25 25 25 25 25 25 26 26 26 26 26 26 26 26 26 26 26
## [76] 26 26 26 26 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27
## [101] 27 27 27 27 27 27 27 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28
## [126] 28 28 28 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29
## [151] 29 29 29 29 29 29 29 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 31 31 31
## [176] 31 31 31 31 31 31 31 31 31 31 31 31 32 32 32 32 32 32 32 32 32 32 32 32 32
## [201] 32 32 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 34 34 34 34 34 34 34 34
## [226] 34 34 34 34 34 34 34 34 34 34 34 34 34 35 35 35 35 35 35 35 35 35 35 35 35
## [251] 35 36 36 36 36 36 36 36 36 36 36 36 37 37 37 37 37 37 37 37 37 37 37 37 37
## [276] 38 38 38 38 38 38 38 38 38 39 39 39 39 39 40 40 41 41 41 41 41 42 44 44 45
Se muestran las tablas de frecuencias del conjunto de datos edades2.
tabla.edades2 <- fdt(x = edades2, breaks="Sturges")
tabla.edades2
## Class limits f rf rf(%) cf cf(%)
## [15.84,18.801) 2 0.01 0.67 2 0.67
## [18.801,21.762) 15 0.05 5.00 17 5.67
## [21.762,24.723) 33 0.11 11.00 50 16.67
## [24.723,27.684) 57 0.19 19.00 107 35.67
## [27.684,30.645) 65 0.22 21.67 172 57.33
## [30.645,33.606) 45 0.15 15.00 217 72.33
## [33.606,36.567) 45 0.15 15.00 262 87.33
## [36.567,39.528) 27 0.09 9.00 289 96.33
## [39.528,42.489) 8 0.03 2.67 297 99.00
## [42.489,45.45) 3 0.01 1.00 300 100.00
hist(edades2, breaks = "Sturges" )
datos.edades2 <- data.frame(x = 1:length(edades2), edad= edades2)
ggplot(datos.edades2, aes(x=x, y=edad))+
geom_point() +
geom_hline(yintercept = mean(edades2), col='red') +
ggtitle(label = "Dispersión de edades2", subtitle = paste("media = ", mean(edades2)))
Las medidas de dispersión varianza y desviación estándar miden el valor de dispersión de un conjunto de datos numéricos.
La dispersión significa que tanto los datos están alejados de la media, el valor de la desviación se compara con la media y se interpreta que tanto los valores distan del valor de la media.
media_edades1 <- mean(edades1)
media_edades2 <- mean(edades2)
media_edades1; media_edades2
## [1] 37.72667
## [1] 29.87667
\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]
\[ S = \sqrt{S^{2}} \]
tabla.varianza.edades1 <- data.frame(x = edades1,
x_media = media_edades1,
xi.menos.media = edades1 - media_edades1,
xi.menos.media.cuad = (edades1 - media_edades1)^2)
tabla.varianza.edades1
## x x_media xi.menos.media xi.menos.media.cuad
## 1 20 37.72667 -17.7266667 314.23471111
## 2 41 37.72667 3.2733333 10.71471111
## 3 40 37.72667 2.2733333 5.16804444
## 4 31 37.72667 -6.7266667 45.24804444
## 5 55 37.72667 17.2733333 298.36804444
## 6 46 37.72667 8.2733333 68.44804444
## 7 26 37.72667 -11.7266667 137.51471111
## 8 34 37.72667 -3.7266667 13.88804444
## 9 59 37.72667 21.2733333 452.55471111
## 10 59 37.72667 21.2733333 452.55471111
## 11 50 37.72667 12.2733333 150.63471111
## 12 31 37.72667 -6.7266667 45.24804444
## 13 35 37.72667 -2.7266667 7.43471111
## 14 26 37.72667 -11.7266667 137.51471111
## 15 49 37.72667 11.2733333 127.08804444
## 16 21 37.72667 -16.7266667 279.78137778
## 17 34 37.72667 -3.7266667 13.88804444
## 18 60 37.72667 22.2733333 496.10137778
## 19 46 37.72667 8.2733333 68.44804444
## 20 49 37.72667 11.2733333 127.08804444
## 21 27 37.72667 -10.7266667 115.06137778
## 22 43 37.72667 5.2733333 27.80804444
## 23 20 37.72667 -17.7266667 314.23471111
## 24 54 37.72667 16.2733333 264.82137778
## 25 19 37.72667 -18.7266667 350.68804444
## 26 26 37.72667 -11.7266667 137.51471111
## 27 38 37.72667 0.2733333 0.07471111
## 28 48 37.72667 10.2733333 105.54137778
## 29 24 37.72667 -13.7266667 188.42137778
## 30 53 37.72667 15.2733333 233.27471111
## 31 30 37.72667 -7.7266667 59.70137778
## 32 22 37.72667 -15.7266667 247.32804444
## 33 44 37.72667 6.2733333 39.35471111
## 34 32 37.72667 -5.7266667 32.79471111
## 35 33 37.72667 -4.7266667 22.34137778
## 36 26 37.72667 -11.7266667 137.51471111
## 37 41 37.72667 3.2733333 10.71471111
## 38 23 37.72667 -14.7266667 216.87471111
## 39 44 37.72667 6.2733333 39.35471111
## 40 21 37.72667 -16.7266667 279.78137778
## 41 21 37.72667 -16.7266667 279.78137778
## 42 19 37.72667 -18.7266667 350.68804444
## 43 58 37.72667 20.2733333 411.00804444
## 44 38 37.72667 0.2733333 0.07471111
## 45 52 37.72667 14.2733333 203.72804444
## 46 45 37.72667 7.2733333 52.90137778
## 47 19 37.72667 -18.7266667 350.68804444
## 48 31 37.72667 -6.7266667 45.24804444
## 49 51 37.72667 13.2733333 176.18137778
## 50 59 37.72667 21.2733333 452.55471111
## 51 28 37.72667 -9.7266667 94.60804444
## 52 54 37.72667 16.2733333 264.82137778
## 53 32 37.72667 -5.7266667 32.79471111
## 54 51 37.72667 13.2733333 176.18137778
## 55 41 37.72667 3.2733333 10.71471111
## 56 21 37.72667 -16.7266667 279.78137778
## 57 27 37.72667 -10.7266667 115.06137778
## 58 35 37.72667 -2.7266667 7.43471111
## 59 43 37.72667 5.2733333 27.80804444
## 60 57 37.72667 19.2733333 371.46137778
## 61 36 37.72667 -1.7266667 2.98137778
## 62 22 37.72667 -15.7266667 247.32804444
## 63 22 37.72667 -15.7266667 247.32804444
## 64 20 37.72667 -17.7266667 314.23471111
## 65 23 37.72667 -14.7266667 216.87471111
## 66 19 37.72667 -18.7266667 350.68804444
## 67 26 37.72667 -11.7266667 137.51471111
## 68 42 37.72667 4.2733333 18.26137778
## 69 43 37.72667 5.2733333 27.80804444
## 70 40 37.72667 2.2733333 5.16804444
## 71 60 37.72667 22.2733333 496.10137778
## 72 40 37.72667 2.2733333 5.16804444
## 73 18 37.72667 -19.7266667 389.14137778
## 74 30 37.72667 -7.7266667 59.70137778
## 75 35 37.72667 -2.7266667 7.43471111
## 76 44 37.72667 6.2733333 39.35471111
## 77 30 37.72667 -7.7266667 59.70137778
## 78 58 37.72667 20.2733333 411.00804444
## 79 19 37.72667 -18.7266667 350.68804444
## 80 54 37.72667 16.2733333 264.82137778
## 81 33 37.72667 -4.7266667 22.34137778
## 82 30 37.72667 -7.7266667 59.70137778
## 83 38 37.72667 0.2733333 0.07471111
## 84 20 37.72667 -17.7266667 314.23471111
## 85 57 37.72667 19.2733333 371.46137778
## 86 26 37.72667 -11.7266667 137.51471111
## 87 52 37.72667 14.2733333 203.72804444
## 88 28 37.72667 -9.7266667 94.60804444
## 89 26 37.72667 -11.7266667 137.51471111
## 90 58 37.72667 20.2733333 411.00804444
## 91 45 37.72667 7.2733333 52.90137778
## 92 36 37.72667 -1.7266667 2.98137778
## 93 31 37.72667 -6.7266667 45.24804444
## 94 37 37.72667 -0.7266667 0.52804444
## 95 29 37.72667 -8.7266667 76.15471111
## 96 32 37.72667 -5.7266667 32.79471111
## 97 25 37.72667 -12.7266667 161.96804444
## 98 30 37.72667 -7.7266667 59.70137778
## 99 42 37.72667 4.2733333 18.26137778
## 100 41 37.72667 3.2733333 10.71471111
## 101 20 37.72667 -17.7266667 314.23471111
## 102 21 37.72667 -16.7266667 279.78137778
## 103 26 37.72667 -11.7266667 137.51471111
## 104 32 37.72667 -5.7266667 32.79471111
## 105 37 37.72667 -0.7266667 0.52804444
## 106 21 37.72667 -16.7266667 279.78137778
## 107 18 37.72667 -19.7266667 389.14137778
## 108 51 37.72667 13.2733333 176.18137778
## 109 51 37.72667 13.2733333 176.18137778
## 110 40 37.72667 2.2733333 5.16804444
## 111 56 37.72667 18.2733333 333.91471111
## 112 20 37.72667 -17.7266667 314.23471111
## 113 42 37.72667 4.2733333 18.26137778
## 114 36 37.72667 -1.7266667 2.98137778
## 115 52 37.72667 14.2733333 203.72804444
## 116 53 37.72667 15.2733333 233.27471111
## 117 26 37.72667 -11.7266667 137.51471111
## 118 39 37.72667 1.2733333 1.62137778
## 119 54 37.72667 16.2733333 264.82137778
## 120 42 37.72667 4.2733333 18.26137778
## 121 31 37.72667 -6.7266667 45.24804444
## 122 39 37.72667 1.2733333 1.62137778
## 123 36 37.72667 -1.7266667 2.98137778
## 124 33 37.72667 -4.7266667 22.34137778
## 125 26 37.72667 -11.7266667 137.51471111
## 126 34 37.72667 -3.7266667 13.88804444
## 127 48 37.72667 10.2733333 105.54137778
## 128 60 37.72667 22.2733333 496.10137778
## 129 18 37.72667 -19.7266667 389.14137778
## 130 42 37.72667 4.2733333 18.26137778
## 131 52 37.72667 14.2733333 203.72804444
## 132 49 37.72667 11.2733333 127.08804444
## 133 28 37.72667 -9.7266667 94.60804444
## 134 40 37.72667 2.2733333 5.16804444
## 135 49 37.72667 11.2733333 127.08804444
## 136 42 37.72667 4.2733333 18.26137778
## 137 44 37.72667 6.2733333 39.35471111
## 138 50 37.72667 12.2733333 150.63471111
## 139 34 37.72667 -3.7266667 13.88804444
## 140 41 37.72667 3.2733333 10.71471111
## 141 38 37.72667 0.2733333 0.07471111
## 142 54 37.72667 16.2733333 264.82137778
## 143 20 37.72667 -17.7266667 314.23471111
## 144 51 37.72667 13.2733333 176.18137778
## 145 38 37.72667 0.2733333 0.07471111
## 146 43 37.72667 5.2733333 27.80804444
## 147 34 37.72667 -3.7266667 13.88804444
## 148 34 37.72667 -3.7266667 13.88804444
## 149 35 37.72667 -2.7266667 7.43471111
## 150 50 37.72667 12.2733333 150.63471111
## 151 32 37.72667 -5.7266667 32.79471111
## 152 42 37.72667 4.2733333 18.26137778
## 153 32 37.72667 -5.7266667 32.79471111
## 154 54 37.72667 16.2733333 264.82137778
## 155 42 37.72667 4.2733333 18.26137778
## 156 36 37.72667 -1.7266667 2.98137778
## 157 24 37.72667 -13.7266667 188.42137778
## 158 28 37.72667 -9.7266667 94.60804444
## 159 51 37.72667 13.2733333 176.18137778
## 160 43 37.72667 5.2733333 27.80804444
## 161 42 37.72667 4.2733333 18.26137778
## 162 42 37.72667 4.2733333 18.26137778
## 163 45 37.72667 7.2733333 52.90137778
## 164 20 37.72667 -17.7266667 314.23471111
## 165 54 37.72667 16.2733333 264.82137778
## 166 50 37.72667 12.2733333 150.63471111
## 167 24 37.72667 -13.7266667 188.42137778
## 168 31 37.72667 -6.7266667 45.24804444
## 169 42 37.72667 4.2733333 18.26137778
## 170 56 37.72667 18.2733333 333.91471111
## 171 42 37.72667 4.2733333 18.26137778
## 172 18 37.72667 -19.7266667 389.14137778
## 173 30 37.72667 -7.7266667 59.70137778
## 174 53 37.72667 15.2733333 233.27471111
## 175 36 37.72667 -1.7266667 2.98137778
## 176 33 37.72667 -4.7266667 22.34137778
## 177 51 37.72667 13.2733333 176.18137778
## 178 33 37.72667 -4.7266667 22.34137778
## 179 22 37.72667 -15.7266667 247.32804444
## 180 34 37.72667 -3.7266667 13.88804444
## 181 30 37.72667 -7.7266667 59.70137778
## 182 60 37.72667 22.2733333 496.10137778
## 183 55 37.72667 17.2733333 298.36804444
## 184 55 37.72667 17.2733333 298.36804444
## 185 58 37.72667 20.2733333 411.00804444
## 186 24 37.72667 -13.7266667 188.42137778
## 187 24 37.72667 -13.7266667 188.42137778
## 188 22 37.72667 -15.7266667 247.32804444
## 189 19 37.72667 -18.7266667 350.68804444
## 190 18 37.72667 -19.7266667 389.14137778
## 191 58 37.72667 20.2733333 411.00804444
## 192 42 37.72667 4.2733333 18.26137778
## 193 43 37.72667 5.2733333 27.80804444
## 194 50 37.72667 12.2733333 150.63471111
## 195 31 37.72667 -6.7266667 45.24804444
## 196 52 37.72667 14.2733333 203.72804444
## 197 60 37.72667 22.2733333 496.10137778
## 198 22 37.72667 -15.7266667 247.32804444
## 199 46 37.72667 8.2733333 68.44804444
## 200 18 37.72667 -19.7266667 389.14137778
## 201 21 37.72667 -16.7266667 279.78137778
## 202 25 37.72667 -12.7266667 161.96804444
## 203 46 37.72667 8.2733333 68.44804444
## 204 24 37.72667 -13.7266667 188.42137778
## 205 38 37.72667 0.2733333 0.07471111
## 206 24 37.72667 -13.7266667 188.42137778
## 207 45 37.72667 7.2733333 52.90137778
## 208 59 37.72667 21.2733333 452.55471111
## 209 24 37.72667 -13.7266667 188.42137778
## 210 40 37.72667 2.2733333 5.16804444
## 211 29 37.72667 -8.7266667 76.15471111
## 212 50 37.72667 12.2733333 150.63471111
## 213 44 37.72667 6.2733333 39.35471111
## 214 46 37.72667 8.2733333 68.44804444
## 215 55 37.72667 17.2733333 298.36804444
## 216 43 37.72667 5.2733333 27.80804444
## 217 34 37.72667 -3.7266667 13.88804444
## 218 42 37.72667 4.2733333 18.26137778
## 219 59 37.72667 21.2733333 452.55471111
## 220 35 37.72667 -2.7266667 7.43471111
## 221 21 37.72667 -16.7266667 279.78137778
## 222 36 37.72667 -1.7266667 2.98137778
## 223 24 37.72667 -13.7266667 188.42137778
## 224 57 37.72667 19.2733333 371.46137778
## 225 31 37.72667 -6.7266667 45.24804444
## 226 45 37.72667 7.2733333 52.90137778
## 227 45 37.72667 7.2733333 52.90137778
## 228 56 37.72667 18.2733333 333.91471111
## 229 45 37.72667 7.2733333 52.90137778
## 230 43 37.72667 5.2733333 27.80804444
## 231 38 37.72667 0.2733333 0.07471111
## 232 28 37.72667 -9.7266667 94.60804444
## 233 21 37.72667 -16.7266667 279.78137778
## 234 41 37.72667 3.2733333 10.71471111
## 235 53 37.72667 15.2733333 233.27471111
## 236 42 37.72667 4.2733333 18.26137778
## 237 22 37.72667 -15.7266667 247.32804444
## 238 51 37.72667 13.2733333 176.18137778
## 239 51 37.72667 13.2733333 176.18137778
## 240 57 37.72667 19.2733333 371.46137778
## 241 57 37.72667 19.2733333 371.46137778
## 242 39 37.72667 1.2733333 1.62137778
## 243 23 37.72667 -14.7266667 216.87471111
## 244 59 37.72667 21.2733333 452.55471111
## 245 24 37.72667 -13.7266667 188.42137778
## 246 58 37.72667 20.2733333 411.00804444
## 247 25 37.72667 -12.7266667 161.96804444
## 248 33 37.72667 -4.7266667 22.34137778
## 249 47 37.72667 9.2733333 85.99471111
## 250 20 37.72667 -17.7266667 314.23471111
## 251 22 37.72667 -15.7266667 247.32804444
## 252 27 37.72667 -10.7266667 115.06137778
## 253 22 37.72667 -15.7266667 247.32804444
## 254 20 37.72667 -17.7266667 314.23471111
## 255 52 37.72667 14.2733333 203.72804444
## 256 24 37.72667 -13.7266667 188.42137778
## 257 42 37.72667 4.2733333 18.26137778
## 258 26 37.72667 -11.7266667 137.51471111
## 259 50 37.72667 12.2733333 150.63471111
## 260 57 37.72667 19.2733333 371.46137778
## 261 36 37.72667 -1.7266667 2.98137778
## 262 49 37.72667 11.2733333 127.08804444
## 263 33 37.72667 -4.7266667 22.34137778
## 264 38 37.72667 0.2733333 0.07471111
## 265 21 37.72667 -16.7266667 279.78137778
## 266 21 37.72667 -16.7266667 279.78137778
## 267 49 37.72667 11.2733333 127.08804444
## 268 28 37.72667 -9.7266667 94.60804444
## 269 51 37.72667 13.2733333 176.18137778
## 270 37 37.72667 -0.7266667 0.52804444
## 271 42 37.72667 4.2733333 18.26137778
## 272 44 37.72667 6.2733333 39.35471111
## 273 26 37.72667 -11.7266667 137.51471111
## 274 25 37.72667 -12.7266667 161.96804444
## 275 52 37.72667 14.2733333 203.72804444
## 276 22 37.72667 -15.7266667 247.32804444
## 277 24 37.72667 -13.7266667 188.42137778
## 278 31 37.72667 -6.7266667 45.24804444
## 279 38 37.72667 0.2733333 0.07471111
## 280 45 37.72667 7.2733333 52.90137778
## 281 50 37.72667 12.2733333 150.63471111
## 282 20 37.72667 -17.7266667 314.23471111
## 283 26 37.72667 -11.7266667 137.51471111
## 284 32 37.72667 -5.7266667 32.79471111
## 285 60 37.72667 22.2733333 496.10137778
## 286 25 37.72667 -12.7266667 161.96804444
## 287 56 37.72667 18.2733333 333.91471111
## 288 56 37.72667 18.2733333 333.91471111
## 289 51 37.72667 13.2733333 176.18137778
## 290 34 37.72667 -3.7266667 13.88804444
## 291 28 37.72667 -9.7266667 94.60804444
## 292 23 37.72667 -14.7266667 216.87471111
## 293 42 37.72667 4.2733333 18.26137778
## 294 38 37.72667 0.2733333 0.07471111
## 295 55 37.72667 17.2733333 298.36804444
## 296 38 37.72667 0.2733333 0.07471111
## 297 33 37.72667 -4.7266667 22.34137778
## 298 33 37.72667 -4.7266667 22.34137778
## 299 45 37.72667 7.2733333 52.90137778
## 300 26 37.72667 -11.7266667 137.51471111
Calculando la suma y determinando varianza
n <- length(edades1)
suma <- sum(tabla.varianza.edades1$xi.menos.media.cuad)
suma
## [1] 45583.59
varianza <- suma / (n -1)
varianza
## [1] 152.4535
Con las funciones de var() y sd() se determinan la varianza y a desviación respectivamente y con mean() la media de la muestra.
varianza_edades1 <- var(edades1)
varianza_edades2 <- var(edades2)
desv.std_edades1 <- sd(edades1)
desv.std_edades2 <- sd(edades2)
Se muestran los valores generados, el punto y coma en R significa en una misma linea se ejecutan dos instrucciones o dos comandos, en este caso solo mostrar los valores.
varianza_edades1; varianza_edades2
## [1] 152.4535
## [1] 29.06501
desv.std_edades1; desv.std_edades2
## [1] 12.3472
## [1] 5.391197
El coeficiente de variación (CV) es un estadístico que permite comparar entre dos o mas conjuntos de datos cuál es estos tiene una dispersión mayor o menor.
Al identificar el CV de un conjunto de datos y compararlo con otro CV de otro conjunto de datos similares, se puede determinar cual de los datos tiene mayor o menor dispersión y se puede concluir en cual es estos está mas dispersos sus datos, es decir cuál de ellos se aleja mas o menos de la media, según sea el caso.
Para determinar el coeficiente de variación se establece la división de la desviación estándar entre la media del conjunto de datos.
\[ CV = \frac{\sigma}{\bar{x}} \]
CV_edades1 <- desv.std_edades1 / media_edades1
CV_edades1
## [1] 0.3272806
CV_edades2 <- desv.std_edades2 / media_edades2
CV_edades2
## [1] 0.1804484
¿Qué representan las tablas de frecuencias para los datos edades?
Las datos correspondientes a las edades de un cierto numero de individuos. Dichas tablas muestran la frecuencia que hay de este valor en ciertos rangos. Por ejemplo tenemos en edades1 que un 14.67% de los datos pertenece al rango de 17.82-22.1. Y con edades2 un 21.67% corresponde al rango de 27.6-30.6
¿Cuáles son los valores media y desviación de los conjuntos de datos edades?
Con respecto a edades1 tenemos una media de 37.726 y una desviacion de 12.34
Con respecto a edades2 tenemos una media de 29.876 y una desviacion de 5.39
¿Cuáles son los valores de coeficiente de variación para los conjuntos de datos edades y que representan?
El coeficiente de variación de edades1 es de: 0.3272806y el CV de edades2 es de: 0.1804484
Para edades1 corresponde a .3272806 y para edades2 .1804484
Podemos observar que hay una mayor dispersion en el conjunto 1 que en el 2
Anderson, David R., Dennis J. Sweeney, and Thomas A. Williams. 2008. Estadística Para Administración y Economía. 10th ed. Australia Brasil Corea España Estados Unidos Japón México Reino Unido Singapur: Cengage Learning,.
Devore, Jay L. 2016b. Fundamentos de Probabilidad y Estadística. Primera Edición. CENGAGE.
———. 2016a. Fundamentos de Probabilidad y Estadística. Primera Edición. CENGAGE.