Determinar medidas de dispersión de datos como edades, sueldos y calificaciones.
Simular muestra de varios conjuntos de datos
Se identifica media de los datos
Se muestran tablas de frecuencias
Se calculan medidas de dispersión, varianza y desviación estándar.
Se visualiza la dispersión de los datos en relación a la media.
Se calcula el coeficiente de variación y se compara con similares conjuntos de datos.
¿Para que sirven las medidas de dispersión?
El reporte de una medida de centralización como la media, mediana y moda sólo da información parcial sobre un conjunto o distribución de datos. Diferentes muestras o poblaciones pueden tener medidas idénticas de centro y aun así diferir una de otra en otras importantes maneras. [@devore2016a].
La imagen siguiente muestra tres conjuntos de datos y los tres tienen media y mediana igual, sin embargo la dispersión es diferentes, es decir cual conjunto de datos se aleja mas de la media.
La primera tiene la cantidad más grande de variabilidad, la tercera tiene la cantidad más pequeña y la segunda es intermedia respecto a las otras dos en este aspecto. [@devore2016].
La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está basada en la diferencia entre el valor de cada observación (\(x_i\)) y la media \(\bar{x}\) [@anderson2008].
Se identifican las fórmulas para varianza poblacional y muestral, dependiendo de los datos a analizar, si es todas las observaciones de la población y solo una muestra de la misma.
Para efectos de este ejercicio se utiliza mas específicamente la varianza y desviación muestral.
\[ \sigma^2 = \frac{\sum_{i=1}^N(x_i- \mu)^2}{N} \]
siendo \(\mu\) la media poblacional y \(N\) el total de los datos de la población.
\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]
siendo \(\bar{x}\) la media muestral y \(n\) el total de los datos de la muestra.
Las unidades al cuadrado de la varianza dificultan la comprensión e interpretación intuitiva de los valores numéricos de la varianza.
La desviación estándar se define como la raíz cuadrada positiva de la varianza.
Continuando con la notación adoptada para la varianza muestral y para la varianza poblacional, se emplea \(\varsigma\) para denotar la desviación estándar muestral y \(\sigma\) para denotar la desviación estándar poblacional.
¿Qué se gana con convertir la varianza en la correspondiente desviación estándar?.
Como la desviación estándar es la raíz cuadrada de la varianza, las unidades de la varianza, son al cuadrado, posiblemente dificulta su interpretación, por tanto, la desviación estándar de se interpreta de mejor manera la variabilidad de los datos porque el valor resultante se mide en las mismas unidades que los datos originales. [@anderson2008].
Una interpretación preliminar de la desviación estándar muestral es que es el tamaño de una desviación típica o representativa de la media muestral dentro de la muestra dada.[@devore2016]
\[ \sigma = \sqrt{\sigma^2} \]
\[ S = \sqrt{S^2} \]
En algunas ocasiones se requiere un estadístico descriptivo que indique cuán grande es la desviación estándar en relación con la media. Existe el coeficiente de variación y resuelve ese propósito.
La fórmula del coeficiente de variación indica el grado de dispersión de un conjunto de datos con respecto a la media.
\[ CV = \left(\frac{\sigma}{\bar{x}} \times 100 \right) \text{%} \]
Instalar librerías anticipadamente con install.packages(“fdth”)
library(fdth) # Para tablas de frecuencias
library(ggplot2) # Para gráficos
Se establece valor de semilla para que se generen los mismos datos.
set.seed(8000)
Se generan 300 edades en dos conjuntos de datos diferentes.
edades1 se genera con función de aleatoriedad sample()
edades2 se genera con la función de distribución normal rnorm().
n <- 300
edades1 <- sample(x = 18:60,size = n,replace = TRUE )
Se identifican los datos edades1
edades1
## [1] 47 48 52 21 28 26 24 31 44 55 44 45 50 28 21 30 37 36 21 54 45 37 28 42 57
## [26] 38 27 28 23 57 19 42 23 50 42 49 51 40 43 56 39 20 45 50 57 60 56 44 36 52
## [51] 26 56 29 49 28 43 26 48 50 39 56 32 28 40 39 39 23 51 60 58 19 42 26 53 59
## [76] 59 39 43 44 27 57 59 57 23 57 56 21 49 29 23 26 23 48 53 25 26 60 22 20 43
## [101] 30 58 28 43 59 39 28 26 55 23 59 41 43 20 48 59 33 20 60 45 25 56 39 28 51
## [126] 53 50 45 19 30 58 43 56 36 58 46 47 51 58 27 42 52 22 39 26 20 25 25 50 25
## [151] 34 47 59 56 20 43 53 48 29 46 28 43 59 44 26 44 49 57 27 36 25 21 57 43 31
## [176] 58 54 30 29 37 18 54 28 25 31 48 40 42 20 54 57 18 53 49 39 37 30 21 28 52
## [201] 58 18 36 38 36 19 41 26 52 60 38 24 34 26 55 48 29 37 47 58 54 28 21 39 40
## [226] 60 39 47 45 51 56 60 29 38 48 55 52 60 37 42 46 47 45 26 41 49 19 44 19 53
## [251] 35 38 25 23 48 37 43 24 29 50 29 35 42 26 29 40 36 38 38 21 56 33 19 44 21
## [276] 49 18 23 53 39 59 43 33 44 24 38 51 48 18 46 43 22 54 20 54 41 56 52 36 32
Se muestran las tablas de frecuencias del conjunto de datos edades1.
En las tablas de frecuencias se determina matemáticamente el número de clases, La opción matemáticamente más consistente es la conocida como regla de Sturges.
La solución de esta ecuación proporciona una regla práctica para obtener el número de clases.
\[ k=1+3.322*log10(n) \]
Siendo k el número de clases
log es la función logarítmica de base 10, log10()
y n el total de la muestra
El rango de clase de acuerdo a Sturges está dada por \[ h=\frac{max(datos) - min(datos)}{k} \]Siendo h el rango de cada clase y max(datos) - min(datos) el rango del total de los datos, es decir la diferencia entre límite superior menos límite inferior.
Existen otras formas de determinar el número de clases a utilizar, algunas más complejas, otras más simples.
Independientemente de la forma de cálculo seleccionada ya se Sturges, Scott o Freedman-Diaconis (FD), lo realmente importante es que la información mostrada en la tabla de frecuencia sea fácil de revisar, que no contenga un número excesivo de clases y que la información que en ella se refleja permita comprender cómo se presentan los datos en la población o de una muestra.
El número de clase de acuerdo par \(n=300\) de acuerdo a Sturges es:
k <- round(1+3.322 * log10(n))
k
## [1] 9
La amplitud h1 y h2 para cada conjunto de datos es igual a:
h = diff(range(edades1)) / k
h
## [1] 4.666667
tabla.edades1 <- fdt(x = edades1, breaks="Sturges")
tabla.edades1
## Class limits f rf rf(%) cf cf(%)
## [17.82,22.1) 32 0.11 10.67 32 10.67
## [22.1,26.38) 34 0.11 11.33 66 22.00
## [26.38,30.65) 31 0.10 10.33 97 32.33
## [30.65,34.93) 10 0.03 3.33 107 35.67
## [34.93,39.21) 37 0.12 12.33 144 48.00
## [39.21,43.49) 30 0.10 10.00 174 58.00
## [43.49,47.77) 26 0.09 8.67 200 66.67
## [47.77,52.04) 37 0.12 12.33 237 79.00
## [52.04,56.32) 29 0.10 9.67 266 88.67
## [56.32,60.6) 34 0.11 11.33 300 100.00
Class limits significa el rango de cada clase
f significa la frecuencia, la suma de f debe ser el total de elementos.
rf significa frecuencia relativa la suma de todas las rf debe ser el 1
rf% significa el valor relativo pero en porcentaje, la suma de rf% debe ser el 100%
cf significa frecuencia acumulada
cf% significa frecuencia porcentual acumulada
hist(edades1, breaks = "Sturges" )
datos.edades1 <- data.frame(x = 1:length(edades1), edad= edades1)
ggplot(datos.edades1, aes(x=x, y=edad))+
geom_point() +
geom_hline(yintercept = mean(edades1), col='red') +
ggtitle(label = "Dispersión de edades1", subtitle = paste("media = ", mean(edades1)))
edades2 <- round(rnorm(n = n, mean = 30, sd = 5))
Se identifican los datos edades2
sort(edades2)
## [1] 15 16 18 18 19 19 19 20 20 20 21 21 21 21 21 21 22 22 22 22 23 23 23 23 23
## [26] 23 24 24 24 24 24 24 24 24 24 24 24 24 24 24 25 25 25 25 25 25 25 25 25 25
## [51] 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 27 27
## [76] 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 28 28 28 28 28 28 28 28
## [101] 28 28 28 28 28 28 28 28 28 28 28 28 29 29 29 29 29 29 29 29 29 29 29 29 29
## [126] 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 30 30 30 30 30 30 30 30 30
## [151] 30 30 30 30 30 30 30 30 30 30 30 30 30 31 31 31 31 31 31 31 31 31 31 31 31
## [176] 31 31 31 31 31 31 31 31 31 31 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32
## [201] 32 32 32 32 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33
## [226] 33 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 35
## [251] 35 35 35 35 35 35 35 35 35 35 35 36 36 36 36 36 36 36 36 37 37 37 37 37 37
## [276] 37 38 38 38 38 38 39 39 39 39 39 39 40 41 41 41 41 41 41 41 43 43 43 43 45
Se muestran las tablas de frecuencias del conjunto de datos edades2.
tabla.edades2 <- fdt(x = edades2, breaks="Sturges")
tabla.edades2
## Class limits f rf rf(%) cf cf(%)
## [14.85,17.91) 2 0.01 0.67 2 0.67
## [17.91,20.97) 8 0.03 2.67 10 3.33
## [20.97,24.03) 30 0.10 10.00 40 13.33
## [24.03,27.09) 52 0.17 17.33 92 30.67
## [27.09,30.15) 71 0.24 23.67 163 54.33
## [30.15,33.21) 63 0.21 21.00 226 75.33
## [33.21,36.27) 43 0.14 14.33 269 89.67
## [36.27,39.33) 18 0.06 6.00 287 95.67
## [39.33,42.39) 8 0.03 2.67 295 98.33
## [42.39,45.45) 5 0.02 1.67 300 100.00
hist(edades2, breaks = "Sturges" )
datos.edades2 <- data.frame(x = 1:length(edades2), edad= edades2)
ggplot(datos.edades2, aes(x=x, y=edad))+
geom_point() +
geom_hline(yintercept = mean(edades2), col='red') +
ggtitle(label = "Dispersión de edades2", subtitle = paste("media = ", mean(edades2)))
Las medidas de dispersión varianza y desviación estándar miden el valor de dispersión de un conjunto de datos numéricos.
La dispersión significa que tanto los datos están alejados de la media, el valor de la desviación se compara con la media y se interpreta que tanto los valores distan del valor de la media.
media_edades1 <- mean(edades1)
media_edades2 <- mean(edades2)
media_edades1; media_edades2
## [1] 39.75667
## [1] 30.09
\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]
\[ S = \sqrt{S^{2}} \]
tabla.varianza.edades1 <- data.frame(x = edades1,
x_media = media_edades1,
xi.menos.media = edades1 - media_edades1,
xi.menos.media.cuad = (edades1 - media_edades1)^2)
tabla.varianza.edades1
## x x_media xi.menos.media xi.menos.media.cuad
## 1 47 39.75667 7.2433333 52.46587778
## 2 48 39.75667 8.2433333 67.95254444
## 3 52 39.75667 12.2433333 149.89921111
## 4 21 39.75667 -18.7566667 351.81254444
## 5 28 39.75667 -11.7566667 138.21921111
## 6 26 39.75667 -13.7566667 189.24587778
## 7 24 39.75667 -15.7566667 248.27254444
## 8 31 39.75667 -8.7566667 76.67921111
## 9 44 39.75667 4.2433333 18.00587778
## 10 55 39.75667 15.2433333 232.35921111
## 11 44 39.75667 4.2433333 18.00587778
## 12 45 39.75667 5.2433333 27.49254444
## 13 50 39.75667 10.2433333 104.92587778
## 14 28 39.75667 -11.7566667 138.21921111
## 15 21 39.75667 -18.7566667 351.81254444
## 16 30 39.75667 -9.7566667 95.19254444
## 17 37 39.75667 -2.7566667 7.59921111
## 18 36 39.75667 -3.7566667 14.11254444
## 19 21 39.75667 -18.7566667 351.81254444
## 20 54 39.75667 14.2433333 202.87254444
## 21 45 39.75667 5.2433333 27.49254444
## 22 37 39.75667 -2.7566667 7.59921111
## 23 28 39.75667 -11.7566667 138.21921111
## 24 42 39.75667 2.2433333 5.03254444
## 25 57 39.75667 17.2433333 297.33254444
## 26 38 39.75667 -1.7566667 3.08587778
## 27 27 39.75667 -12.7566667 162.73254444
## 28 28 39.75667 -11.7566667 138.21921111
## 29 23 39.75667 -16.7566667 280.78587778
## 30 57 39.75667 17.2433333 297.33254444
## 31 19 39.75667 -20.7566667 430.83921111
## 32 42 39.75667 2.2433333 5.03254444
## 33 23 39.75667 -16.7566667 280.78587778
## 34 50 39.75667 10.2433333 104.92587778
## 35 42 39.75667 2.2433333 5.03254444
## 36 49 39.75667 9.2433333 85.43921111
## 37 51 39.75667 11.2433333 126.41254444
## 38 40 39.75667 0.2433333 0.05921111
## 39 43 39.75667 3.2433333 10.51921111
## 40 56 39.75667 16.2433333 263.84587778
## 41 39 39.75667 -0.7566667 0.57254444
## 42 20 39.75667 -19.7566667 390.32587778
## 43 45 39.75667 5.2433333 27.49254444
## 44 50 39.75667 10.2433333 104.92587778
## 45 57 39.75667 17.2433333 297.33254444
## 46 60 39.75667 20.2433333 409.79254444
## 47 56 39.75667 16.2433333 263.84587778
## 48 44 39.75667 4.2433333 18.00587778
## 49 36 39.75667 -3.7566667 14.11254444
## 50 52 39.75667 12.2433333 149.89921111
## 51 26 39.75667 -13.7566667 189.24587778
## 52 56 39.75667 16.2433333 263.84587778
## 53 29 39.75667 -10.7566667 115.70587778
## 54 49 39.75667 9.2433333 85.43921111
## 55 28 39.75667 -11.7566667 138.21921111
## 56 43 39.75667 3.2433333 10.51921111
## 57 26 39.75667 -13.7566667 189.24587778
## 58 48 39.75667 8.2433333 67.95254444
## 59 50 39.75667 10.2433333 104.92587778
## 60 39 39.75667 -0.7566667 0.57254444
## 61 56 39.75667 16.2433333 263.84587778
## 62 32 39.75667 -7.7566667 60.16587778
## 63 28 39.75667 -11.7566667 138.21921111
## 64 40 39.75667 0.2433333 0.05921111
## 65 39 39.75667 -0.7566667 0.57254444
## 66 39 39.75667 -0.7566667 0.57254444
## 67 23 39.75667 -16.7566667 280.78587778
## 68 51 39.75667 11.2433333 126.41254444
## 69 60 39.75667 20.2433333 409.79254444
## 70 58 39.75667 18.2433333 332.81921111
## 71 19 39.75667 -20.7566667 430.83921111
## 72 42 39.75667 2.2433333 5.03254444
## 73 26 39.75667 -13.7566667 189.24587778
## 74 53 39.75667 13.2433333 175.38587778
## 75 59 39.75667 19.2433333 370.30587778
## 76 59 39.75667 19.2433333 370.30587778
## 77 39 39.75667 -0.7566667 0.57254444
## 78 43 39.75667 3.2433333 10.51921111
## 79 44 39.75667 4.2433333 18.00587778
## 80 27 39.75667 -12.7566667 162.73254444
## 81 57 39.75667 17.2433333 297.33254444
## 82 59 39.75667 19.2433333 370.30587778
## 83 57 39.75667 17.2433333 297.33254444
## 84 23 39.75667 -16.7566667 280.78587778
## 85 57 39.75667 17.2433333 297.33254444
## 86 56 39.75667 16.2433333 263.84587778
## 87 21 39.75667 -18.7566667 351.81254444
## 88 49 39.75667 9.2433333 85.43921111
## 89 29 39.75667 -10.7566667 115.70587778
## 90 23 39.75667 -16.7566667 280.78587778
## 91 26 39.75667 -13.7566667 189.24587778
## 92 23 39.75667 -16.7566667 280.78587778
## 93 48 39.75667 8.2433333 67.95254444
## 94 53 39.75667 13.2433333 175.38587778
## 95 25 39.75667 -14.7566667 217.75921111
## 96 26 39.75667 -13.7566667 189.24587778
## 97 60 39.75667 20.2433333 409.79254444
## 98 22 39.75667 -17.7566667 315.29921111
## 99 20 39.75667 -19.7566667 390.32587778
## 100 43 39.75667 3.2433333 10.51921111
## 101 30 39.75667 -9.7566667 95.19254444
## 102 58 39.75667 18.2433333 332.81921111
## 103 28 39.75667 -11.7566667 138.21921111
## 104 43 39.75667 3.2433333 10.51921111
## 105 59 39.75667 19.2433333 370.30587778
## 106 39 39.75667 -0.7566667 0.57254444
## 107 28 39.75667 -11.7566667 138.21921111
## 108 26 39.75667 -13.7566667 189.24587778
## 109 55 39.75667 15.2433333 232.35921111
## 110 23 39.75667 -16.7566667 280.78587778
## 111 59 39.75667 19.2433333 370.30587778
## 112 41 39.75667 1.2433333 1.54587778
## 113 43 39.75667 3.2433333 10.51921111
## 114 20 39.75667 -19.7566667 390.32587778
## 115 48 39.75667 8.2433333 67.95254444
## 116 59 39.75667 19.2433333 370.30587778
## 117 33 39.75667 -6.7566667 45.65254444
## 118 20 39.75667 -19.7566667 390.32587778
## 119 60 39.75667 20.2433333 409.79254444
## 120 45 39.75667 5.2433333 27.49254444
## 121 25 39.75667 -14.7566667 217.75921111
## 122 56 39.75667 16.2433333 263.84587778
## 123 39 39.75667 -0.7566667 0.57254444
## 124 28 39.75667 -11.7566667 138.21921111
## 125 51 39.75667 11.2433333 126.41254444
## 126 53 39.75667 13.2433333 175.38587778
## 127 50 39.75667 10.2433333 104.92587778
## 128 45 39.75667 5.2433333 27.49254444
## 129 19 39.75667 -20.7566667 430.83921111
## 130 30 39.75667 -9.7566667 95.19254444
## 131 58 39.75667 18.2433333 332.81921111
## 132 43 39.75667 3.2433333 10.51921111
## 133 56 39.75667 16.2433333 263.84587778
## 134 36 39.75667 -3.7566667 14.11254444
## 135 58 39.75667 18.2433333 332.81921111
## 136 46 39.75667 6.2433333 38.97921111
## 137 47 39.75667 7.2433333 52.46587778
## 138 51 39.75667 11.2433333 126.41254444
## 139 58 39.75667 18.2433333 332.81921111
## 140 27 39.75667 -12.7566667 162.73254444
## 141 42 39.75667 2.2433333 5.03254444
## 142 52 39.75667 12.2433333 149.89921111
## 143 22 39.75667 -17.7566667 315.29921111
## 144 39 39.75667 -0.7566667 0.57254444
## 145 26 39.75667 -13.7566667 189.24587778
## 146 20 39.75667 -19.7566667 390.32587778
## 147 25 39.75667 -14.7566667 217.75921111
## 148 25 39.75667 -14.7566667 217.75921111
## 149 50 39.75667 10.2433333 104.92587778
## 150 25 39.75667 -14.7566667 217.75921111
## 151 34 39.75667 -5.7566667 33.13921111
## 152 47 39.75667 7.2433333 52.46587778
## 153 59 39.75667 19.2433333 370.30587778
## 154 56 39.75667 16.2433333 263.84587778
## 155 20 39.75667 -19.7566667 390.32587778
## 156 43 39.75667 3.2433333 10.51921111
## 157 53 39.75667 13.2433333 175.38587778
## 158 48 39.75667 8.2433333 67.95254444
## 159 29 39.75667 -10.7566667 115.70587778
## 160 46 39.75667 6.2433333 38.97921111
## 161 28 39.75667 -11.7566667 138.21921111
## 162 43 39.75667 3.2433333 10.51921111
## 163 59 39.75667 19.2433333 370.30587778
## 164 44 39.75667 4.2433333 18.00587778
## 165 26 39.75667 -13.7566667 189.24587778
## 166 44 39.75667 4.2433333 18.00587778
## 167 49 39.75667 9.2433333 85.43921111
## 168 57 39.75667 17.2433333 297.33254444
## 169 27 39.75667 -12.7566667 162.73254444
## 170 36 39.75667 -3.7566667 14.11254444
## 171 25 39.75667 -14.7566667 217.75921111
## 172 21 39.75667 -18.7566667 351.81254444
## 173 57 39.75667 17.2433333 297.33254444
## 174 43 39.75667 3.2433333 10.51921111
## 175 31 39.75667 -8.7566667 76.67921111
## 176 58 39.75667 18.2433333 332.81921111
## 177 54 39.75667 14.2433333 202.87254444
## 178 30 39.75667 -9.7566667 95.19254444
## 179 29 39.75667 -10.7566667 115.70587778
## 180 37 39.75667 -2.7566667 7.59921111
## 181 18 39.75667 -21.7566667 473.35254444
## 182 54 39.75667 14.2433333 202.87254444
## 183 28 39.75667 -11.7566667 138.21921111
## 184 25 39.75667 -14.7566667 217.75921111
## 185 31 39.75667 -8.7566667 76.67921111
## 186 48 39.75667 8.2433333 67.95254444
## 187 40 39.75667 0.2433333 0.05921111
## 188 42 39.75667 2.2433333 5.03254444
## 189 20 39.75667 -19.7566667 390.32587778
## 190 54 39.75667 14.2433333 202.87254444
## 191 57 39.75667 17.2433333 297.33254444
## 192 18 39.75667 -21.7566667 473.35254444
## 193 53 39.75667 13.2433333 175.38587778
## 194 49 39.75667 9.2433333 85.43921111
## 195 39 39.75667 -0.7566667 0.57254444
## 196 37 39.75667 -2.7566667 7.59921111
## 197 30 39.75667 -9.7566667 95.19254444
## 198 21 39.75667 -18.7566667 351.81254444
## 199 28 39.75667 -11.7566667 138.21921111
## 200 52 39.75667 12.2433333 149.89921111
## 201 58 39.75667 18.2433333 332.81921111
## 202 18 39.75667 -21.7566667 473.35254444
## 203 36 39.75667 -3.7566667 14.11254444
## 204 38 39.75667 -1.7566667 3.08587778
## 205 36 39.75667 -3.7566667 14.11254444
## 206 19 39.75667 -20.7566667 430.83921111
## 207 41 39.75667 1.2433333 1.54587778
## 208 26 39.75667 -13.7566667 189.24587778
## 209 52 39.75667 12.2433333 149.89921111
## 210 60 39.75667 20.2433333 409.79254444
## 211 38 39.75667 -1.7566667 3.08587778
## 212 24 39.75667 -15.7566667 248.27254444
## 213 34 39.75667 -5.7566667 33.13921111
## 214 26 39.75667 -13.7566667 189.24587778
## 215 55 39.75667 15.2433333 232.35921111
## 216 48 39.75667 8.2433333 67.95254444
## 217 29 39.75667 -10.7566667 115.70587778
## 218 37 39.75667 -2.7566667 7.59921111
## 219 47 39.75667 7.2433333 52.46587778
## 220 58 39.75667 18.2433333 332.81921111
## 221 54 39.75667 14.2433333 202.87254444
## 222 28 39.75667 -11.7566667 138.21921111
## 223 21 39.75667 -18.7566667 351.81254444
## 224 39 39.75667 -0.7566667 0.57254444
## 225 40 39.75667 0.2433333 0.05921111
## 226 60 39.75667 20.2433333 409.79254444
## 227 39 39.75667 -0.7566667 0.57254444
## 228 47 39.75667 7.2433333 52.46587778
## 229 45 39.75667 5.2433333 27.49254444
## 230 51 39.75667 11.2433333 126.41254444
## 231 56 39.75667 16.2433333 263.84587778
## 232 60 39.75667 20.2433333 409.79254444
## 233 29 39.75667 -10.7566667 115.70587778
## 234 38 39.75667 -1.7566667 3.08587778
## 235 48 39.75667 8.2433333 67.95254444
## 236 55 39.75667 15.2433333 232.35921111
## 237 52 39.75667 12.2433333 149.89921111
## 238 60 39.75667 20.2433333 409.79254444
## 239 37 39.75667 -2.7566667 7.59921111
## 240 42 39.75667 2.2433333 5.03254444
## 241 46 39.75667 6.2433333 38.97921111
## 242 47 39.75667 7.2433333 52.46587778
## 243 45 39.75667 5.2433333 27.49254444
## 244 26 39.75667 -13.7566667 189.24587778
## 245 41 39.75667 1.2433333 1.54587778
## 246 49 39.75667 9.2433333 85.43921111
## 247 19 39.75667 -20.7566667 430.83921111
## 248 44 39.75667 4.2433333 18.00587778
## 249 19 39.75667 -20.7566667 430.83921111
## 250 53 39.75667 13.2433333 175.38587778
## 251 35 39.75667 -4.7566667 22.62587778
## 252 38 39.75667 -1.7566667 3.08587778
## 253 25 39.75667 -14.7566667 217.75921111
## 254 23 39.75667 -16.7566667 280.78587778
## 255 48 39.75667 8.2433333 67.95254444
## 256 37 39.75667 -2.7566667 7.59921111
## 257 43 39.75667 3.2433333 10.51921111
## 258 24 39.75667 -15.7566667 248.27254444
## 259 29 39.75667 -10.7566667 115.70587778
## 260 50 39.75667 10.2433333 104.92587778
## 261 29 39.75667 -10.7566667 115.70587778
## 262 35 39.75667 -4.7566667 22.62587778
## 263 42 39.75667 2.2433333 5.03254444
## 264 26 39.75667 -13.7566667 189.24587778
## 265 29 39.75667 -10.7566667 115.70587778
## 266 40 39.75667 0.2433333 0.05921111
## 267 36 39.75667 -3.7566667 14.11254444
## 268 38 39.75667 -1.7566667 3.08587778
## 269 38 39.75667 -1.7566667 3.08587778
## 270 21 39.75667 -18.7566667 351.81254444
## 271 56 39.75667 16.2433333 263.84587778
## 272 33 39.75667 -6.7566667 45.65254444
## 273 19 39.75667 -20.7566667 430.83921111
## 274 44 39.75667 4.2433333 18.00587778
## 275 21 39.75667 -18.7566667 351.81254444
## 276 49 39.75667 9.2433333 85.43921111
## 277 18 39.75667 -21.7566667 473.35254444
## 278 23 39.75667 -16.7566667 280.78587778
## 279 53 39.75667 13.2433333 175.38587778
## 280 39 39.75667 -0.7566667 0.57254444
## 281 59 39.75667 19.2433333 370.30587778
## 282 43 39.75667 3.2433333 10.51921111
## 283 33 39.75667 -6.7566667 45.65254444
## 284 44 39.75667 4.2433333 18.00587778
## 285 24 39.75667 -15.7566667 248.27254444
## 286 38 39.75667 -1.7566667 3.08587778
## 287 51 39.75667 11.2433333 126.41254444
## 288 48 39.75667 8.2433333 67.95254444
## 289 18 39.75667 -21.7566667 473.35254444
## 290 46 39.75667 6.2433333 38.97921111
## 291 43 39.75667 3.2433333 10.51921111
## 292 22 39.75667 -17.7566667 315.29921111
## 293 54 39.75667 14.2433333 202.87254444
## 294 20 39.75667 -19.7566667 390.32587778
## 295 54 39.75667 14.2433333 202.87254444
## 296 41 39.75667 1.2433333 1.54587778
## 297 56 39.75667 16.2433333 263.84587778
## 298 52 39.75667 12.2433333 149.89921111
## 299 36 39.75667 -3.7566667 14.11254444
## 300 32 39.75667 -7.7566667 60.16587778
Calculando la suma y determinando varianza
n <- length(edades1)
suma <- sum(tabla.varianza.edades1$xi.menos.media.cuad)
suma
## [1] 48359.24
varianza <- suma / (n -1)
varianza
## [1] 161.7366
Con las funciones de var() y sd() se determinan la varianza y a desviación respectivamente y con mean() la media de la muestra.
varianza_edades1 <- var(edades1)
varianza_edades2 <- var(edades2)
desv.std_edades1 <- sd(edades1)
desv.std_edades2 <- sd(edades2)
Se muestran los valores generados, el punto y coma en R significa en una misma linea se ejecutan dos instrucciones o dos comandos, en este caso solo mostrar los valores.
varianza_edades1; varianza_edades2
## [1] 161.7366
## [1] 26.94505
desv.std_edades1; desv.std_edades2
## [1] 12.71757
## [1] 5.190862
El coeficiente de variación (CV) es un estadístico que permite comparar entre dos o mas conjuntos de datos cuál es estos tiene una dispersión mayor o menor.
Al identificar el CV de un conjunto de datos y compararlo con otro CV de otro conjunto de datos similares, se puede determinar cual de los datos tiene mayor o menor dispersión y se puede concluir en cual es estos está mas dispersos sus datos, es decir cuál de ellos se aleja mas o menos de la media, según sea el caso.
Para determinar el coeficiente de variación se establece la división de la desviación estándar entre la media del conjunto de datos.
\[ CV = \frac{\sigma}{\bar{x}} \]
CV_edades1 <- desv.std_edades1 / media_edades1
CV_edades1
## [1] 0.3198852
CV_edades2 <- desv.std_edades2 / media_edades2
CV_edades2
## [1] 0.1725112
¿Qué representan las tablas de frecuencias para los datos edades?
En la tabla de frecuencias podemos ver la clases y las frecuencias de estas, así como los valores relativos y porcentuales.
En edades1 podemos observar que un 12.33% de los datos se encuentran en el rango de 34.93 y 39.21
En relación a edades2 existe una cantidad de valores entre 27.09 y 30.15 que representan el 23.67%.
¿Cuáles son los valores media y desviación de los conjuntos de datos edades?
Con nuestro conjunto de datos edades1 podemos encontrar media de 39.75 y una desviación de: 12.71
Con respecto a los valores estadísticos del conjunto de datos edades2, el valor la media es de: 30.09, la desviación es de: 5.19.
¿Cuáles son los valores de coeficiente de variación para los conjuntos de datos edades y que representan?
El coeficiente de variación de edades1 es de: 0.3198852y el CV de edades2 es de: 0.1725112
Podemos observas que existe una mayor dispersion en el conjunto edades 1 que en el conjunto edades 2
Anderson, David R., Dennis J. Sweeney, and Thomas A. Williams. 2008. Estadística Para Administración y Economía. 10th ed. Australia Brasil Corea España Estados Unidos Japón México Reino Unido Singapur: Cengage Learning,.
Devore, Jay L. 2016b. Fundamentos de Probabilidad y Estadística. Primera Edición. CENGAGE.
———. 2016a. Fundamentos de Probabilidad y Estadística. Primera Edición. CENGAGE.