Determinar medidas de dispersión de datos como edades, sueldos y calificaciones.
Simular muestra de varios conjuntos de datos
Se identifica media de los datos
Se muestran tablas de frecuencias
Se calculan medidas de dispersión, varianza y desviación estándar.
Se visualiza la dispersión de los datos en relación a la media.
Se calcula el coeficiente de variación y se compara con similares conjuntos de datos.
¿Para que sirven las medidas de dispersión?
El reporte de una medida de centralización como la media, mediana y moda sólo da información parcial sobre un conjunto o distribución de datos. Diferentes muestras o poblaciones pueden tener medidas idénticas de centro y aun así diferir una de otra en otras importantes maneras. [@devore2016a].
La imagen siguiente muestra tres conjuntos de datos y los tres tienen media y mediana igual, sin embargo la dispersión es diferentes, es decir cual conjunto de datos se aleja mas de la media.
La primera tiene la cantidad más grande de variabilidad, la tercera tiene la cantidad más pequeña y la segunda es intermedia respecto a las otras dos en este aspecto. [@devore2016].
La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está basada en la diferencia entre el valor de cada observación (\(x_i\)) y la media \(\bar{x}\) [@anderson2008].
Se identifican las fórmulas para varianza poblacional y muestral, dependiendo de los datos a analizar, si es todas las observaciones de la población y solo una muestra de la misma.
Para efectos de este ejercicio se utiliza mas específicamente la varianza y desviación muestral.
\[ \sigma^2 = \frac{\sum_{i=1}^N(x_i- \mu)^2}{N} \]
siendo \(\mu\) la media poblacional y \(N\) el total de los datos de la población.
\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]
siendo \(\bar{x}\) la media muestral y \(n\) el total de los datos de la muestra.
Las unidades al cuadrado de la varianza dificultan la comprensión e interpretación intuitiva de los valores numéricos de la varianza.
La desviación estándar se define como la raíz cuadrada positiva de la varianza.
Continuando con la notación adoptada para la varianza muestral y para la varianza poblacional, se emplea \(\varsigma\) para denotar la desviación estándar muestral y \(\sigma\) para denotar la desviación estándar poblacional.
¿Qué se gana con convertir la varianza en la correspondiente desviación estándar?.
Como la desviación estándar es la raíz cuadrada de la varianza, las unidades de la varianza, son al cuadrado, posiblemente dificulta su interpretación, por tanto, la desviación estándar de se interpreta de mejor manera la variabilidad de los datos porque el valor resultante se mide en las mismas unidades que los datos originales. [@anderson2008].
Una interpretación preliminar de la desviación estándar muestral es que es el tamaño de una desviación típica o representativa de la media muestral dentro de la muestra dada.[@devore2016]
\[ \sigma = \sqrt{\sigma^2} \]
\[ S = \sqrt{S^2} \]
En algunas ocasiones se requiere un estadístico descriptivo que indique cuán grande es la desviación estándar en relación con la media. Existe el coeficiente de variación y resuelve ese propósito.
La fórmula del coeficiente de variación indica el grado de dispersión de un conjunto de datos con respecto a la media.
\[ CV = \left(\frac{\sigma}{\bar{x}} \times 100 \right) \text{%} \]
Instalar librerías anticipadamente con install.packages(“fdth”)
library(fdth) # Para tablas de frecuencias
library(ggplot2) # Para gráficos
Se establece valor de semilla para que se generen los mismos datos.
set.seed(400)
Se generan 400 edades en dos conjuntos de datos diferentes.
edades1 se genera con función de aleatoriedad sample()
edades2 se genera con la función de distribución normal rnorm().
n <- 400
edades1 <- sample(x = 18:60,size = n,replace = TRUE )
Se identifican los datos edades1
edades1
## [1] 54 40 40 45 39 45 31 30 31 24 58 44 57 53 55 59 38 45 35 53 18 22 52 37 48
## [26] 38 37 44 27 45 35 40 21 55 18 28 26 26 31 37 39 37 43 25 53 58 50 58 24 20
## [51] 45 46 29 24 30 37 46 56 19 20 38 19 47 29 21 58 24 54 57 56 46 32 24 54 21
## [76] 23 47 19 59 60 45 39 55 26 20 55 27 36 59 57 52 33 21 23 43 21 54 33 35 19
## [101] 44 28 60 43 35 25 52 57 24 44 30 40 37 39 25 30 33 27 33 53 31 29 33 22 60
## [126] 44 19 60 19 57 46 43 36 22 23 19 59 41 58 33 18 33 38 43 44 24 34 46 32 53
## [151] 57 24 58 50 34 34 55 43 37 48 57 30 31 39 40 47 59 57 41 30 33 42 31 25 43
## [176] 20 44 47 30 31 48 30 35 19 37 29 34 35 60 57 18 51 57 44 38 35 34 34 34 53
## [201] 28 26 57 37 56 42 43 54 42 34 57 52 48 38 20 28 34 31 25 19 35 38 44 43 57
## [226] 34 43 21 28 25 57 39 22 51 27 37 45 52 53 53 47 29 47 59 38 47 54 20 49 28
## [251] 40 45 35 50 59 29 51 27 49 42 49 49 25 33 40 48 43 41 42 25 50 41 18 54 35
## [276] 51 40 29 27 42 44 46 37 26 41 47 35 28 33 48 33 37 53 49 54 54 53 49 44 38
## [301] 22 39 55 43 38 26 48 31 18 53 44 60 31 39 59 40 36 21 26 59 25 33 32 27 60
## [326] 22 19 25 33 58 54 40 46 36 46 51 50 29 26 54 42 40 34 21 24 50 33 46 25 59
## [351] 53 32 31 26 18 54 30 22 21 20 19 58 58 25 48 45 48 31 60 24 38 40 49 38 58
## [376] 42 58 56 40 51 43 41 59 35 18 48 31 43 23 43 30 60 59 36 37 39 34 19 56 23
Se muestran las tablas de frecuencias del conjunto de datos edades1.
En las tablas de frecuencias se determina matemáticamente el número de clases, La opción matemáticamente más consistente es la conocida como regla de Sturges.
La solución de esta ecuación proporciona una regla práctica para obtener el número de clases.
\[ k=1+3.322*log10(n) \]
Siendo k el número de clases
log es la función logarítmica de base 10, log10()
y n el total de la muestra
El rango de clase de acuerdo a Sturges está dada por \[ h=\frac{max(datos) - min(datos)}{k} \]Siendo h el rango de cada clase y max(datos) - min(datos) el rango del total de los datos, es decir la diferencia entre límite superior menos límite inferior.
Existen otras formas de determinar el número de clases a utilizar, algunas más complejas, otras más simples.
Independientemente de la forma de cálculo seleccionada ya se Sturges, Scott o Freedman-Diaconis (FD), lo realmente importante es que la información mostrada en la tabla de frecuencia sea fácil de revisar, que no contenga un número excesivo de clases y que la información que en ella se refleja permita comprender cómo se presentan los datos en la población o de una muestra.
El número de clase de acuerdo par \(n=400\) de acuerdo a Sturges es:
k <- round(1+3.322 * log10(n))
k
## [1] 10
La amplitud h1 y h2 para cada conjunto de datos es igual a:
h = diff(range(edades1)) / k
h
## [1] 4.2
tabla.edades1 <- fdt(x = edades1, breaks="Sturges")
tabla.edades1
## Class limits f rf rf(%) cf cf(%)
## [17.82,22.1) 43 0.11 10.75 43 10.75
## [22.1,26.38) 36 0.09 9.00 79 19.75
## [26.38,30.65) 32 0.08 8.00 111 27.75
## [30.65,34.93) 43 0.11 10.75 154 38.50
## [34.93,39.21) 51 0.13 12.75 205 51.25
## [39.21,43.49) 42 0.10 10.50 247 61.75
## [43.49,47.77) 38 0.10 9.50 285 71.25
## [47.77,52.04) 34 0.09 8.50 319 79.75
## [52.04,56.32) 35 0.09 8.75 354 88.50
## [56.32,60.6) 46 0.12 11.50 400 100.00
Class limits significa el rango de cada clase
f significa la frecuencia, la suma de f debe ser el total de elementos.
rf significa frecuencia relativa la suma de todas las rf debe ser el 1
rf% significa el valor relativo pero en porcentaje, la suma de rf% debe ser el 100%
cf significa frecuencia acumulada
cf% significa frecuencia porcentual acumulada
hist(edades1, breaks = "Sturges" )
datos.edades1 <- data.frame(x = 1:length(edades1), edad= edades1)
ggplot(datos.edades1, aes(x=x, y=edad))+
geom_point() +
geom_hline(yintercept = mean(edades1), col='red') +
ggtitle(label = "Dispersión de edades1", subtitle = paste("media = ", mean(edades1)))
edades2 <- round(rnorm(n = n, mean = 30, sd = 5))
Se identifican los datos edades2
sort(edades2)
## [1] 15 16 16 17 17 18 19 19 20 20 20 20 20 20 21 21 21 21 21 21 22 22 22 22 22
## [26] 22 22 22 22 22 22 23 23 23 23 23 23 23 23 23 23 23 23 23 24 24 24 24 24 24
## [51] 24 24 24 24 24 24 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 26
## [76] 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 27
## [101] 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27
## [126] 27 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28
## [151] 28 28 28 28 28 28 28 28 28 28 28 29 29 29 29 29 29 29 29 29 29 29 29 29 29
## [176] 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 30 30 30 30
## [201] 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 31 31
## [226] 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31
## [251] 31 31 31 31 31 31 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32
## [276] 32 32 32 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33
## [301] 33 33 33 33 33 33 33 33 33 33 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34
## [326] 34 34 34 34 34 34 34 34 35 35 35 35 35 35 35 35 35 35 35 35 35 35 35 35 36
## [351] 36 36 36 36 36 36 36 36 36 36 37 37 37 37 37 37 37 37 37 37 37 37 37 37 37
## [376] 37 38 38 38 38 38 38 38 38 38 38 39 39 39 39 40 40 40 40 40 41 42 42 45 46
Se muestran las tablas de frecuencias del conjunto de datos edades2.
hist(edades2, breaks = "Sturges" )
datos.edades2 <- data.frame(x = 1:length(edades2), edad= edades2)
ggplot(datos.edades2, aes(x=x, y=edad))+
geom_point() +
geom_hline(yintercept = mean(edades2), col='red') +
ggtitle(label = "Dispersión de edades2", subtitle = paste("media = ", mean(edades2)))
Las medidas de dispersión varianza y desviación estándar miden el valor de dispersión de un conjunto de datos numéricos.
La dispersión significa que tanto los datos están alejados de la media, el valor de la desviación se compara con la media y se interpreta que tanto los valores distan del valor de la media.
media_edades1 <- mean(edades1)
media_edades2 <- mean(edades2)
media_edades1; media_edades2
## [1] 39.2175
## [1] 29.7775
\[ S^2 = \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1} \]
\[ S = \sqrt{S^{2}} \]
tabla.varianza.edades1 <- data.frame(x = edades1,
x_media = media_edades1,
xi.menos.media = edades1 - media_edades1,
xi.menos.media.cuad = (edades1 - media_edades1)^2)
tabla.varianza.edades1
## x x_media xi.menos.media xi.menos.media.cuad
## 1 54 39.2175 14.7825 218.52230625
## 2 40 39.2175 0.7825 0.61230625
## 3 40 39.2175 0.7825 0.61230625
## 4 45 39.2175 5.7825 33.43730625
## 5 39 39.2175 -0.2175 0.04730625
## 6 45 39.2175 5.7825 33.43730625
## 7 31 39.2175 -8.2175 67.52730625
## 8 30 39.2175 -9.2175 84.96230625
## 9 31 39.2175 -8.2175 67.52730625
## 10 24 39.2175 -15.2175 231.57230625
## 11 58 39.2175 18.7825 352.78230625
## 12 44 39.2175 4.7825 22.87230625
## 13 57 39.2175 17.7825 316.21730625
## 14 53 39.2175 13.7825 189.95730625
## 15 55 39.2175 15.7825 249.08730625
## 16 59 39.2175 19.7825 391.34730625
## 17 38 39.2175 -1.2175 1.48230625
## 18 45 39.2175 5.7825 33.43730625
## 19 35 39.2175 -4.2175 17.78730625
## 20 53 39.2175 13.7825 189.95730625
## 21 18 39.2175 -21.2175 450.18230625
## 22 22 39.2175 -17.2175 296.44230625
## 23 52 39.2175 12.7825 163.39230625
## 24 37 39.2175 -2.2175 4.91730625
## 25 48 39.2175 8.7825 77.13230625
## 26 38 39.2175 -1.2175 1.48230625
## 27 37 39.2175 -2.2175 4.91730625
## 28 44 39.2175 4.7825 22.87230625
## 29 27 39.2175 -12.2175 149.26730625
## 30 45 39.2175 5.7825 33.43730625
## 31 35 39.2175 -4.2175 17.78730625
## 32 40 39.2175 0.7825 0.61230625
## 33 21 39.2175 -18.2175 331.87730625
## 34 55 39.2175 15.7825 249.08730625
## 35 18 39.2175 -21.2175 450.18230625
## 36 28 39.2175 -11.2175 125.83230625
## 37 26 39.2175 -13.2175 174.70230625
## 38 26 39.2175 -13.2175 174.70230625
## 39 31 39.2175 -8.2175 67.52730625
## 40 37 39.2175 -2.2175 4.91730625
## 41 39 39.2175 -0.2175 0.04730625
## 42 37 39.2175 -2.2175 4.91730625
## 43 43 39.2175 3.7825 14.30730625
## 44 25 39.2175 -14.2175 202.13730625
## 45 53 39.2175 13.7825 189.95730625
## 46 58 39.2175 18.7825 352.78230625
## 47 50 39.2175 10.7825 116.26230625
## 48 58 39.2175 18.7825 352.78230625
## 49 24 39.2175 -15.2175 231.57230625
## 50 20 39.2175 -19.2175 369.31230625
## 51 45 39.2175 5.7825 33.43730625
## 52 46 39.2175 6.7825 46.00230625
## 53 29 39.2175 -10.2175 104.39730625
## 54 24 39.2175 -15.2175 231.57230625
## 55 30 39.2175 -9.2175 84.96230625
## 56 37 39.2175 -2.2175 4.91730625
## 57 46 39.2175 6.7825 46.00230625
## 58 56 39.2175 16.7825 281.65230625
## 59 19 39.2175 -20.2175 408.74730625
## 60 20 39.2175 -19.2175 369.31230625
## 61 38 39.2175 -1.2175 1.48230625
## 62 19 39.2175 -20.2175 408.74730625
## 63 47 39.2175 7.7825 60.56730625
## 64 29 39.2175 -10.2175 104.39730625
## 65 21 39.2175 -18.2175 331.87730625
## 66 58 39.2175 18.7825 352.78230625
## 67 24 39.2175 -15.2175 231.57230625
## 68 54 39.2175 14.7825 218.52230625
## 69 57 39.2175 17.7825 316.21730625
## 70 56 39.2175 16.7825 281.65230625
## 71 46 39.2175 6.7825 46.00230625
## 72 32 39.2175 -7.2175 52.09230625
## 73 24 39.2175 -15.2175 231.57230625
## 74 54 39.2175 14.7825 218.52230625
## 75 21 39.2175 -18.2175 331.87730625
## 76 23 39.2175 -16.2175 263.00730625
## 77 47 39.2175 7.7825 60.56730625
## 78 19 39.2175 -20.2175 408.74730625
## 79 59 39.2175 19.7825 391.34730625
## 80 60 39.2175 20.7825 431.91230625
## 81 45 39.2175 5.7825 33.43730625
## 82 39 39.2175 -0.2175 0.04730625
## 83 55 39.2175 15.7825 249.08730625
## 84 26 39.2175 -13.2175 174.70230625
## 85 20 39.2175 -19.2175 369.31230625
## 86 55 39.2175 15.7825 249.08730625
## 87 27 39.2175 -12.2175 149.26730625
## 88 36 39.2175 -3.2175 10.35230625
## 89 59 39.2175 19.7825 391.34730625
## 90 57 39.2175 17.7825 316.21730625
## 91 52 39.2175 12.7825 163.39230625
## 92 33 39.2175 -6.2175 38.65730625
## 93 21 39.2175 -18.2175 331.87730625
## 94 23 39.2175 -16.2175 263.00730625
## 95 43 39.2175 3.7825 14.30730625
## 96 21 39.2175 -18.2175 331.87730625
## 97 54 39.2175 14.7825 218.52230625
## 98 33 39.2175 -6.2175 38.65730625
## 99 35 39.2175 -4.2175 17.78730625
## 100 19 39.2175 -20.2175 408.74730625
## 101 44 39.2175 4.7825 22.87230625
## 102 28 39.2175 -11.2175 125.83230625
## 103 60 39.2175 20.7825 431.91230625
## 104 43 39.2175 3.7825 14.30730625
## 105 35 39.2175 -4.2175 17.78730625
## 106 25 39.2175 -14.2175 202.13730625
## 107 52 39.2175 12.7825 163.39230625
## 108 57 39.2175 17.7825 316.21730625
## 109 24 39.2175 -15.2175 231.57230625
## 110 44 39.2175 4.7825 22.87230625
## 111 30 39.2175 -9.2175 84.96230625
## 112 40 39.2175 0.7825 0.61230625
## 113 37 39.2175 -2.2175 4.91730625
## 114 39 39.2175 -0.2175 0.04730625
## 115 25 39.2175 -14.2175 202.13730625
## 116 30 39.2175 -9.2175 84.96230625
## 117 33 39.2175 -6.2175 38.65730625
## 118 27 39.2175 -12.2175 149.26730625
## 119 33 39.2175 -6.2175 38.65730625
## 120 53 39.2175 13.7825 189.95730625
## 121 31 39.2175 -8.2175 67.52730625
## 122 29 39.2175 -10.2175 104.39730625
## 123 33 39.2175 -6.2175 38.65730625
## 124 22 39.2175 -17.2175 296.44230625
## 125 60 39.2175 20.7825 431.91230625
## 126 44 39.2175 4.7825 22.87230625
## 127 19 39.2175 -20.2175 408.74730625
## 128 60 39.2175 20.7825 431.91230625
## 129 19 39.2175 -20.2175 408.74730625
## 130 57 39.2175 17.7825 316.21730625
## 131 46 39.2175 6.7825 46.00230625
## 132 43 39.2175 3.7825 14.30730625
## 133 36 39.2175 -3.2175 10.35230625
## 134 22 39.2175 -17.2175 296.44230625
## 135 23 39.2175 -16.2175 263.00730625
## 136 19 39.2175 -20.2175 408.74730625
## 137 59 39.2175 19.7825 391.34730625
## 138 41 39.2175 1.7825 3.17730625
## 139 58 39.2175 18.7825 352.78230625
## 140 33 39.2175 -6.2175 38.65730625
## 141 18 39.2175 -21.2175 450.18230625
## 142 33 39.2175 -6.2175 38.65730625
## 143 38 39.2175 -1.2175 1.48230625
## 144 43 39.2175 3.7825 14.30730625
## 145 44 39.2175 4.7825 22.87230625
## 146 24 39.2175 -15.2175 231.57230625
## 147 34 39.2175 -5.2175 27.22230625
## 148 46 39.2175 6.7825 46.00230625
## 149 32 39.2175 -7.2175 52.09230625
## 150 53 39.2175 13.7825 189.95730625
## 151 57 39.2175 17.7825 316.21730625
## 152 24 39.2175 -15.2175 231.57230625
## 153 58 39.2175 18.7825 352.78230625
## 154 50 39.2175 10.7825 116.26230625
## 155 34 39.2175 -5.2175 27.22230625
## 156 34 39.2175 -5.2175 27.22230625
## 157 55 39.2175 15.7825 249.08730625
## 158 43 39.2175 3.7825 14.30730625
## 159 37 39.2175 -2.2175 4.91730625
## 160 48 39.2175 8.7825 77.13230625
## 161 57 39.2175 17.7825 316.21730625
## 162 30 39.2175 -9.2175 84.96230625
## 163 31 39.2175 -8.2175 67.52730625
## 164 39 39.2175 -0.2175 0.04730625
## 165 40 39.2175 0.7825 0.61230625
## 166 47 39.2175 7.7825 60.56730625
## 167 59 39.2175 19.7825 391.34730625
## 168 57 39.2175 17.7825 316.21730625
## 169 41 39.2175 1.7825 3.17730625
## 170 30 39.2175 -9.2175 84.96230625
## 171 33 39.2175 -6.2175 38.65730625
## 172 42 39.2175 2.7825 7.74230625
## 173 31 39.2175 -8.2175 67.52730625
## 174 25 39.2175 -14.2175 202.13730625
## 175 43 39.2175 3.7825 14.30730625
## 176 20 39.2175 -19.2175 369.31230625
## 177 44 39.2175 4.7825 22.87230625
## 178 47 39.2175 7.7825 60.56730625
## 179 30 39.2175 -9.2175 84.96230625
## 180 31 39.2175 -8.2175 67.52730625
## 181 48 39.2175 8.7825 77.13230625
## 182 30 39.2175 -9.2175 84.96230625
## 183 35 39.2175 -4.2175 17.78730625
## 184 19 39.2175 -20.2175 408.74730625
## 185 37 39.2175 -2.2175 4.91730625
## 186 29 39.2175 -10.2175 104.39730625
## 187 34 39.2175 -5.2175 27.22230625
## 188 35 39.2175 -4.2175 17.78730625
## 189 60 39.2175 20.7825 431.91230625
## 190 57 39.2175 17.7825 316.21730625
## 191 18 39.2175 -21.2175 450.18230625
## 192 51 39.2175 11.7825 138.82730625
## 193 57 39.2175 17.7825 316.21730625
## 194 44 39.2175 4.7825 22.87230625
## 195 38 39.2175 -1.2175 1.48230625
## 196 35 39.2175 -4.2175 17.78730625
## 197 34 39.2175 -5.2175 27.22230625
## 198 34 39.2175 -5.2175 27.22230625
## 199 34 39.2175 -5.2175 27.22230625
## 200 53 39.2175 13.7825 189.95730625
## 201 28 39.2175 -11.2175 125.83230625
## 202 26 39.2175 -13.2175 174.70230625
## 203 57 39.2175 17.7825 316.21730625
## 204 37 39.2175 -2.2175 4.91730625
## 205 56 39.2175 16.7825 281.65230625
## 206 42 39.2175 2.7825 7.74230625
## 207 43 39.2175 3.7825 14.30730625
## 208 54 39.2175 14.7825 218.52230625
## 209 42 39.2175 2.7825 7.74230625
## 210 34 39.2175 -5.2175 27.22230625
## 211 57 39.2175 17.7825 316.21730625
## 212 52 39.2175 12.7825 163.39230625
## 213 48 39.2175 8.7825 77.13230625
## 214 38 39.2175 -1.2175 1.48230625
## 215 20 39.2175 -19.2175 369.31230625
## 216 28 39.2175 -11.2175 125.83230625
## 217 34 39.2175 -5.2175 27.22230625
## 218 31 39.2175 -8.2175 67.52730625
## 219 25 39.2175 -14.2175 202.13730625
## 220 19 39.2175 -20.2175 408.74730625
## 221 35 39.2175 -4.2175 17.78730625
## 222 38 39.2175 -1.2175 1.48230625
## 223 44 39.2175 4.7825 22.87230625
## 224 43 39.2175 3.7825 14.30730625
## 225 57 39.2175 17.7825 316.21730625
## 226 34 39.2175 -5.2175 27.22230625
## 227 43 39.2175 3.7825 14.30730625
## 228 21 39.2175 -18.2175 331.87730625
## 229 28 39.2175 -11.2175 125.83230625
## 230 25 39.2175 -14.2175 202.13730625
## 231 57 39.2175 17.7825 316.21730625
## 232 39 39.2175 -0.2175 0.04730625
## 233 22 39.2175 -17.2175 296.44230625
## 234 51 39.2175 11.7825 138.82730625
## 235 27 39.2175 -12.2175 149.26730625
## 236 37 39.2175 -2.2175 4.91730625
## 237 45 39.2175 5.7825 33.43730625
## 238 52 39.2175 12.7825 163.39230625
## 239 53 39.2175 13.7825 189.95730625
## 240 53 39.2175 13.7825 189.95730625
## 241 47 39.2175 7.7825 60.56730625
## 242 29 39.2175 -10.2175 104.39730625
## 243 47 39.2175 7.7825 60.56730625
## 244 59 39.2175 19.7825 391.34730625
## 245 38 39.2175 -1.2175 1.48230625
## 246 47 39.2175 7.7825 60.56730625
## 247 54 39.2175 14.7825 218.52230625
## 248 20 39.2175 -19.2175 369.31230625
## 249 49 39.2175 9.7825 95.69730625
## 250 28 39.2175 -11.2175 125.83230625
## 251 40 39.2175 0.7825 0.61230625
## 252 45 39.2175 5.7825 33.43730625
## 253 35 39.2175 -4.2175 17.78730625
## 254 50 39.2175 10.7825 116.26230625
## 255 59 39.2175 19.7825 391.34730625
## 256 29 39.2175 -10.2175 104.39730625
## 257 51 39.2175 11.7825 138.82730625
## 258 27 39.2175 -12.2175 149.26730625
## 259 49 39.2175 9.7825 95.69730625
## 260 42 39.2175 2.7825 7.74230625
## 261 49 39.2175 9.7825 95.69730625
## 262 49 39.2175 9.7825 95.69730625
## 263 25 39.2175 -14.2175 202.13730625
## 264 33 39.2175 -6.2175 38.65730625
## 265 40 39.2175 0.7825 0.61230625
## 266 48 39.2175 8.7825 77.13230625
## 267 43 39.2175 3.7825 14.30730625
## 268 41 39.2175 1.7825 3.17730625
## 269 42 39.2175 2.7825 7.74230625
## 270 25 39.2175 -14.2175 202.13730625
## 271 50 39.2175 10.7825 116.26230625
## 272 41 39.2175 1.7825 3.17730625
## 273 18 39.2175 -21.2175 450.18230625
## 274 54 39.2175 14.7825 218.52230625
## 275 35 39.2175 -4.2175 17.78730625
## 276 51 39.2175 11.7825 138.82730625
## 277 40 39.2175 0.7825 0.61230625
## 278 29 39.2175 -10.2175 104.39730625
## 279 27 39.2175 -12.2175 149.26730625
## 280 42 39.2175 2.7825 7.74230625
## 281 44 39.2175 4.7825 22.87230625
## 282 46 39.2175 6.7825 46.00230625
## 283 37 39.2175 -2.2175 4.91730625
## 284 26 39.2175 -13.2175 174.70230625
## 285 41 39.2175 1.7825 3.17730625
## 286 47 39.2175 7.7825 60.56730625
## 287 35 39.2175 -4.2175 17.78730625
## 288 28 39.2175 -11.2175 125.83230625
## 289 33 39.2175 -6.2175 38.65730625
## 290 48 39.2175 8.7825 77.13230625
## 291 33 39.2175 -6.2175 38.65730625
## 292 37 39.2175 -2.2175 4.91730625
## 293 53 39.2175 13.7825 189.95730625
## 294 49 39.2175 9.7825 95.69730625
## 295 54 39.2175 14.7825 218.52230625
## 296 54 39.2175 14.7825 218.52230625
## 297 53 39.2175 13.7825 189.95730625
## 298 49 39.2175 9.7825 95.69730625
## 299 44 39.2175 4.7825 22.87230625
## 300 38 39.2175 -1.2175 1.48230625
## 301 22 39.2175 -17.2175 296.44230625
## 302 39 39.2175 -0.2175 0.04730625
## 303 55 39.2175 15.7825 249.08730625
## 304 43 39.2175 3.7825 14.30730625
## 305 38 39.2175 -1.2175 1.48230625
## 306 26 39.2175 -13.2175 174.70230625
## 307 48 39.2175 8.7825 77.13230625
## 308 31 39.2175 -8.2175 67.52730625
## 309 18 39.2175 -21.2175 450.18230625
## 310 53 39.2175 13.7825 189.95730625
## 311 44 39.2175 4.7825 22.87230625
## 312 60 39.2175 20.7825 431.91230625
## 313 31 39.2175 -8.2175 67.52730625
## 314 39 39.2175 -0.2175 0.04730625
## 315 59 39.2175 19.7825 391.34730625
## 316 40 39.2175 0.7825 0.61230625
## 317 36 39.2175 -3.2175 10.35230625
## 318 21 39.2175 -18.2175 331.87730625
## 319 26 39.2175 -13.2175 174.70230625
## 320 59 39.2175 19.7825 391.34730625
## 321 25 39.2175 -14.2175 202.13730625
## 322 33 39.2175 -6.2175 38.65730625
## 323 32 39.2175 -7.2175 52.09230625
## 324 27 39.2175 -12.2175 149.26730625
## 325 60 39.2175 20.7825 431.91230625
## 326 22 39.2175 -17.2175 296.44230625
## 327 19 39.2175 -20.2175 408.74730625
## 328 25 39.2175 -14.2175 202.13730625
## 329 33 39.2175 -6.2175 38.65730625
## 330 58 39.2175 18.7825 352.78230625
## 331 54 39.2175 14.7825 218.52230625
## 332 40 39.2175 0.7825 0.61230625
## 333 46 39.2175 6.7825 46.00230625
## 334 36 39.2175 -3.2175 10.35230625
## 335 46 39.2175 6.7825 46.00230625
## 336 51 39.2175 11.7825 138.82730625
## 337 50 39.2175 10.7825 116.26230625
## 338 29 39.2175 -10.2175 104.39730625
## 339 26 39.2175 -13.2175 174.70230625
## 340 54 39.2175 14.7825 218.52230625
## 341 42 39.2175 2.7825 7.74230625
## 342 40 39.2175 0.7825 0.61230625
## 343 34 39.2175 -5.2175 27.22230625
## 344 21 39.2175 -18.2175 331.87730625
## 345 24 39.2175 -15.2175 231.57230625
## 346 50 39.2175 10.7825 116.26230625
## 347 33 39.2175 -6.2175 38.65730625
## 348 46 39.2175 6.7825 46.00230625
## 349 25 39.2175 -14.2175 202.13730625
## 350 59 39.2175 19.7825 391.34730625
## 351 53 39.2175 13.7825 189.95730625
## 352 32 39.2175 -7.2175 52.09230625
## 353 31 39.2175 -8.2175 67.52730625
## 354 26 39.2175 -13.2175 174.70230625
## 355 18 39.2175 -21.2175 450.18230625
## 356 54 39.2175 14.7825 218.52230625
## 357 30 39.2175 -9.2175 84.96230625
## 358 22 39.2175 -17.2175 296.44230625
## 359 21 39.2175 -18.2175 331.87730625
## 360 20 39.2175 -19.2175 369.31230625
## 361 19 39.2175 -20.2175 408.74730625
## 362 58 39.2175 18.7825 352.78230625
## 363 58 39.2175 18.7825 352.78230625
## 364 25 39.2175 -14.2175 202.13730625
## 365 48 39.2175 8.7825 77.13230625
## 366 45 39.2175 5.7825 33.43730625
## 367 48 39.2175 8.7825 77.13230625
## 368 31 39.2175 -8.2175 67.52730625
## 369 60 39.2175 20.7825 431.91230625
## 370 24 39.2175 -15.2175 231.57230625
## 371 38 39.2175 -1.2175 1.48230625
## 372 40 39.2175 0.7825 0.61230625
## 373 49 39.2175 9.7825 95.69730625
## 374 38 39.2175 -1.2175 1.48230625
## 375 58 39.2175 18.7825 352.78230625
## 376 42 39.2175 2.7825 7.74230625
## 377 58 39.2175 18.7825 352.78230625
## 378 56 39.2175 16.7825 281.65230625
## 379 40 39.2175 0.7825 0.61230625
## 380 51 39.2175 11.7825 138.82730625
## 381 43 39.2175 3.7825 14.30730625
## 382 41 39.2175 1.7825 3.17730625
## 383 59 39.2175 19.7825 391.34730625
## 384 35 39.2175 -4.2175 17.78730625
## 385 18 39.2175 -21.2175 450.18230625
## 386 48 39.2175 8.7825 77.13230625
## 387 31 39.2175 -8.2175 67.52730625
## 388 43 39.2175 3.7825 14.30730625
## 389 23 39.2175 -16.2175 263.00730625
## 390 43 39.2175 3.7825 14.30730625
## 391 30 39.2175 -9.2175 84.96230625
## 392 60 39.2175 20.7825 431.91230625
## 393 59 39.2175 19.7825 391.34730625
## 394 36 39.2175 -3.2175 10.35230625
## 395 37 39.2175 -2.2175 4.91730625
## 396 39 39.2175 -0.2175 0.04730625
## 397 34 39.2175 -5.2175 27.22230625
## 398 19 39.2175 -20.2175 408.74730625
## 399 56 39.2175 16.7825 281.65230625
## 400 23 39.2175 -16.2175 263.00730625
Calculando la suma y determinando varianza
n <- length(edades1)
suma <- sum(tabla.varianza.edades1$xi.menos.media.cuad)
suma
## [1] 59956.08
varianza <- suma / (n -1)
varianza
## [1] 150.2659
Con las funciones de var() y sd() se determinan la varianza y a desviación respectivamente y con mean() la media de la muestra.
varianza_edades1 <- var(edades1)
varianza_edades2 <- var(edades2)
desv.std_edades1 <- sd(edades1)
desv.std_edades2 <- sd(edades2)
Se muestran los valores generados, el punto y coma en R significa en una misma linea se ejecutan dos instrucciones o dos comandos, en este caso solo mostrar los valores.
varianza_edades1; varianza_edades2
## [1] 150.2659
## [1] 25.46165
desv.std_edades1; desv.std_edades2
## [1] 12.2583
## [1] 5.045954
El coeficiente de variación (CV) es un estadístico que permite comparar entre dos o mas conjuntos de datos cuál es estos tiene una dispersión mayor o menor.
Al identificar el CV de un conjunto de datos y compararlo con otro CV de otro conjunto de datos similares, se puede determinar cual de los datos tiene mayor o menor dispersión y se puede concluir en cual es estos está mas dispersos sus datos, es decir cuál de ellos se aleja mas o menos de la media, según sea el caso.
Para determinar el coeficiente de variación se establece la división de la desviación estándar entre la media del conjunto de datos.
\[ CV = \frac{\sigma}{\bar{x}} \]
CV_edades1 <- desv.std_edades1 / media_edades1
CV_edades1
## [1] 0.3125721
CV_edades2 <- desv.std_edades2 / media_edades2
CV_edades2
## [1] 0.1694552
¿Qué representan las tablas de frecuencias para los datos edades?
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente. Frecuencia absoluta: La frecuencia absoluta o simplemente frecuencia es el número de veces que aparece un determinado valor en un estudio estadístico.
Con respecto a edades1 existe un 4,2% de valores que están en un rango o intervalo entre 17,82 y 60.6.
En relación a edades2 existe una cantidad de valores entre 36.83 y 46.34 que representan el 14.5%.
¿Cuáles son los valores media y desviación de los conjuntos de datos edades?
Con respecto a los valores estadísticos del conjunto de datos edades1, el valor la media es de: 39.21, la desviación es de: 31201.58.
Con respecto a los valores estadísticos del conjunto de datos edades2, el valor la media es de: 29.605, la desviación es de: 156.7919.
¿Cuáles son los valores de coeficiente de variación para los conjuntos de datos edades y que representan?
El coeficiente de variación de edades1 es de: 0.3243112 y el CV de edades2 es de: 0.1750384
Existe mayor dispersión en los valores del conjunto de datos edades1 con respecto a edades2 por tener ligeramente mayor valor en su coeficiente de variación.