Identificar, describir e interpretar medidas de variabilidad en un conjunto de datos.
El caso se relaciona con identificar medidas de variabilidad como la varianza, la desviación estándar y el coeficiente de variación.
Primero se utilizan datos del libro del autor (Anderson, Sweeney, and Williams 2008a) como ejemplo para calcular la varianza, y a partir de ahí, se determina la desviación y finalmente el coeficiente de variación.
Segundo con datos de alumnos se calculan las mismas medias de dispersión, luego, se selecciona tres carreras y se determina cuál de los tres conjuntos de datos tiene mayor o menor dispersión conforme al valor % del coeficiente de variación.
¿Para que sirven las medidas de dispersión?
El reporte de una medida de centralización como la media, mediana y moda sólo da información parcial sobre un conjunto o distribución de datos. Diferentes muestras o poblaciones pueden tener medidas idénticas de centro y aun así diferir una de otra en otras importantes maneras. (Devore 2016a)
La imagen siguiente muestra tres conjuntos de datos y los tres tienen media y mediana igual, sin embargo la dispersión es diferentes, es decir cual conjunto de datos se aleja mas de la media.
La primera tiene la cantidad más grande de variabilidad, la tercera tiene la cantidad más pequeña y la segunda es intermedia respecto a las otras dos en este aspecto. (Devore 2016a).
Figura. Muestras con dispersión diferente. [@devore2016a]
La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está basada en la diferencia entre el valor de cada observación (xi) y la media x¯ .(Anderson, Sweeney, and Williams 2008a).
Se identifican las fórmulas para varianza poblacional y muestral, dependiendo de los datos a analizar, si es todas las observaciones de la población y solo una muestra de la misma.
Para efectos de este ejercicio se utiliza mas específicamente la varianza y desviación muestral.
siendo la media poblacional y el total de los datos de la población.
siendo la media muestral y el total de los datos de la muestra.
Las unidades al cuadrado de la varianza dificultan la comprensión e interpretación intuitiva de los valores numéricos de la varianza. ##3.2 Desviación estándar La desviación estándar se define como la raíz cuadrada positiva de la varianza.
Continuando con la notación adoptada para la varianza muestral y para la varianza poblacional, se emplea para denotar la desviación estándar muestral y para denotar la desviación estándar poblacional.
¿Qué se gana con convertir la varianza en la correspondiente desviación estándar?.
Como la desviación estándar es la raíz cuadrada de la varianza, las unidades de la varianza, son al cuadrado, posiblemente dificulta su interpretación, por tanto, la desviación estándar de se interpreta de mejor manera la variabilidad de los datos porque el valor resultante se mide en las mismas unidades que los datos originales. (Anderson, Sweeney, and Williams 2008a).
Una interpretación preliminar de la desviación estándar muestral es que es el tamaño de una desviación típica o representativa de la media muestral dentro de la muestra dada.(Devore 2016b) ###3.2.1 Fórmula de desviación estándar poblacional
##3.3 Coeficiente de variación (CV) En algunas ocasiones se requiere un estadístico descriptivo que indique cuán grande es la desviación estándar en relación con la media. Existe el coeficiente de variación y resuelve ese propósito.
La fórmula del coeficiente de variación indica el grado de dispersión de un conjunto de datos con respecto a la media.
Cargas las librerías necesarias para los ejercisio de todo el caso.
library(readr)
library(ggplot2)
El desarrollo del caso inicia con un ejercicio obtenido del libro de (Anderson, Sweeney, and Williams 2008a). El segundo ejercicio serán los datos de alumnos con la variable Promedio ya conocidos en casos anteriores.
Son datos de sueldos en dólares de trabajadores de una empresa.
datos <- c(3450,3550, 3650, 3480, 3355, 1000, 3490, 3730, 3540, 4507, 3520, 3480 )
datos <- data.frame(xi=datos)
Primero se creó un vector llamado datos, luego ese mismo vector se transformó en data.frame con el mismo nombre de datos.
En las siguientes lineas de código R, se utiliza una función llamada cbind() para agregar columnas al data.frame existente llamado datos. La función nrow() sirve para identificar cuántas observaciones tiene la muestra de los datos, es decir, el valor de n =12.
Al final debe haber un conjunto de datos con cinco columnas, “xi, media, diferencia, alcuadrado.”
Se determina la sumatoria de las diferencias al cuadrado conforme a la fórmula y con ello el valor de la varianza. Se genra tambien la variable media para utilizarse a lo largo del caso.
n <- nrow(datos)
summary(datos)
## xi
## Min. :1000
## 1st Qu.:3472
## Median :3505
## Mean :3396
## 3rd Qu.:3575
## Max. :4507
datos <- cbind(datos, media = mean(datos$xi))
datos <- cbind(datos, diferencia=datos$xi - datos$media)
datos <- cbind(datos, alcuadrado = datos$diferencia^2)
media <- mean(datos$xi)
datos
## xi media diferencia alcuadrado
## 1 3450 3396 54 2916
## 2 3550 3396 154 23716
## 3 3650 3396 254 64516
## 4 3480 3396 84 7056
## 5 3355 3396 -41 1681
## 6 1000 3396 -2396 5740816
## 7 3490 3396 94 8836
## 8 3730 3396 334 111556
## 9 3540 3396 144 20736
## 10 4507 3396 1111 1234321
## 11 3520 3396 124 15376
## 12 3480 3396 84 7056
sumatoria <- sum(datos$alcuadrado)
sumatoria
## [1] 7238582
varianza <- sumatoria / (n-1)
varianza
## [1] 658052.9
desviacion <- sqrt(varianza)
desviacion
## [1] 811.2046
CV <- desviacion / media * 100
CV
## [1] 23.88706
El Coeficiente de Variación indica que la desviación estándar muestral es sólo 4.6794627 % del valor de la media muestral. Entre más bajo sea el valor porcentual del CV menor dispersión se encuentran en los datos. En general, el coeficiente de variación es un estadístico útil para comparar la variabilidad de variables que tienen desviaciones estándar distintas y medias distintas. (Anderson, Sweeney, and Williams 2008b).
Existen funciones en R que sirven para determinar varianza, desviación de manera directa, con ellas se podrá determinar de igual forma el coeficiente de variación. Las funciones son var() y sd() respectivamente para varianza y desviación estándar.
var(datos$xi)
## [1] 658052.9
sd(datos$xi)
## [1] 811.2046
CV <- sd(datos$xi) / mean(datos$xi) * 100
CV
## [1] 23.88706
Se muestra la dispersión del sueldo de cada trabajador y la linea horizontal indicando la media.
titulo <- "Sueldos"
subtitulo <- paste("Media =", round(media,2)," Varianza=",round(varianza,2)," Desv. Std.=",round(desviacion,2), " CV =", round(CV, 2),"%")
ggplot(data = datos, mapping = aes(x = 1:n, y = xi)) +
geom_point(colour = "red") +
geom_hline(yintercept = media, colour = "purple") +
ggtitle(titulo, subtitle = subtitulo) +
xlab('Observaciones') + ylab('Sueldos')
Se presenta un ejercicio de medidas de dispersión con datos de alumnos
Se descargan datos de la dirección url “Datos de alumno con promedio superior a cero” de github,; los datos ya vienen con la variable Promedio de todas las observaciones superior a cero. En los casos 5 y 4 se tuvo la necesidad de limpiar observaciones, en este caso 6 ya no es necesario hacer dicha tarea de limpieza de registros.
Nuevamente se utiliza la función readr() para descargar un archivo texto (CSV) separado por comas; en esta misma función se utiliza el argumento stringsAsFactors = TRUE que significa que desde la carga de los datos y desde un inicio se considere como categóricas o tipo factor a las variable que vienen como tipo string o character del conjunto de datos que se carga.
Se utiliza la función str() para conocer el tipo de estructura de los datos, además, despliega los tipos de datos de cada variable, las que son numéricas, factor, entre otros, y la cantidad de registros del conjunto de datos cargado a R.
Nuevamente la función summary() muestra sólo las columnas 2,4,8 y 9 únicamente, summary(datos[c(2,4,8,9)]).
datos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos.alumnosEJ2021.csv", stringsAsFactors = TRUE)
#datos$Carrera <- factor(datos$Carrera)
summary(datos[c(2,4,8,9)])
## X Alumno Promedio Carrera
## Min. : 1 Min. : 1.0 Min. : 70.00 INDUSTRIAL : 653
## 1st Qu.:1384 1st Qu.:106.0 1st Qu.: 83.25 ARQUITECTURA : 633
## Median :2768 Median :239.0 Median : 86.36 CIVIL : 594
## Mean :2768 Mean :262.2 Mean : 86.60 GESTION : 518
## 3rd Qu.:4152 3rd Qu.:388.0 3rd Qu.: 89.83 QUIMICA : 515
## Max. :5535 Max. :755.0 Max. :100.00 ADMINISTRACION: 458
## (Other) :2164
str(datos)
## 'data.frame': 5535 obs. of 9 variables:
## $ X.1 : int 1 2 3 4 5 6 7 8 9 10 ...
## $ X : int 1 2 3 4 5 6 7 8 9 10 ...
## $ NoControl : int 1 2 3 4 5 6 7 8 9 10 ...
## $ Alumno : int 1 2 3 4 5 6 7 8 9 10 ...
## $ Semestre : int 12 13 10 13 10 10 13 11 11 10 ...
## $ Cr.Aprobados: int 207 226 235 231 235 235 231 197 235 231 ...
## $ Cr.Cursando : int 19 9 10 14 10 10 4 23 10 4 ...
## $ Promedio : num 79.8 82.5 95.2 79.3 92.7 ...
## $ Carrera : Factor w/ 14 levels "ADMINISTRACION",..: 13 13 13 13 13 13 13 13 13 13 ...
Los primeros cincuenta registros
head(datos[,c(2,8,9)], 50)
## X Promedio Carrera
## 1 1 79.84 SISTEMAS
## 2 2 82.55 SISTEMAS
## 3 3 95.16 SISTEMAS
## 4 4 79.32 SISTEMAS
## 5 5 92.67 SISTEMAS
## 6 6 91.25 SISTEMAS
## 7 7 82.46 SISTEMAS
## 8 8 83.72 SISTEMAS
## 9 9 85.37 SISTEMAS
## 10 10 85.12 SISTEMAS
## 11 11 78.22 SISTEMAS
## 12 12 91.25 SISTEMAS
## 13 13 84.59 SISTEMAS
## 14 14 89.16 SISTEMAS
## 15 15 82.51 SISTEMAS
## 16 16 81.58 SISTEMAS
## 17 17 82.63 SISTEMAS
## 18 18 87.18 SISTEMAS
## 19 19 89.55 SISTEMAS
## 20 20 86.27 SISTEMAS
## 21 21 84.02 SISTEMAS
## 22 22 82.23 SISTEMAS
## 23 23 83.37 SISTEMAS
## 24 24 92.67 SISTEMAS
## 25 25 82.75 SISTEMAS
## 26 26 95.94 SISTEMAS
## 27 27 91.27 SISTEMAS
## 28 28 89.33 SISTEMAS
## 29 29 86.02 SISTEMAS
## 30 30 83.45 SISTEMAS
## 31 31 80.81 SISTEMAS
## 32 32 78.33 SISTEMAS
## 33 33 89.35 SISTEMAS
## 34 34 83.76 SISTEMAS
## 35 35 80.42 SISTEMAS
## 36 36 94.43 SISTEMAS
## 37 37 83.29 SISTEMAS
## 38 38 87.72 SISTEMAS
## 39 39 85.25 SISTEMAS
## 40 40 93.16 SISTEMAS
## 41 41 81.88 SISTEMAS
## 42 42 80.86 SISTEMAS
## 43 43 82.24 SISTEMAS
## 44 44 87.78 SISTEMAS
## 45 45 81.60 SISTEMAS
## 46 46 84.83 SISTEMAS
## 47 47 83.71 SISTEMAS
## 48 48 90.44 SISTEMAS
## 49 49 90.79 SISTEMAS
## 50 50 89.08 SISTEMAS
Los últimos cincuenta registros
tail(datos[,c(2,8,9)], 50)
## X Promedio Carrera
## 5486 5486 87.70 ARQUITECTURA
## 5487 5487 81.96 ARQUITECTURA
## 5488 5488 85.45 ARQUITECTURA
## 5489 5489 93.75 ARQUITECTURA
## 5490 5490 82.33 ARQUITECTURA
## 5491 5491 82.80 ARQUITECTURA
## 5492 5492 76.71 ARQUITECTURA
## 5493 5493 87.05 ARQUITECTURA
## 5494 5494 87.50 ARQUITECTURA
## 5495 5495 83.70 ARQUITECTURA
## 5496 5496 93.50 ARQUITECTURA
## 5497 5497 91.67 ARQUITECTURA
## 5498 5498 89.67 ARQUITECTURA
## 5499 5499 89.83 ARQUITECTURA
## 5500 5500 87.03 ARQUITECTURA
## 5501 5501 87.25 ARQUITECTURA
## 5502 5502 77.91 ARQUITECTURA
## 5503 5503 88.38 ARQUITECTURA
## 5504 5504 89.00 ARQUITECTURA
## 5505 5505 86.17 ARQUITECTURA
## 5506 5506 86.40 ARQUITECTURA
## 5507 5507 91.50 ARQUITECTURA
## 5508 5508 84.33 ARQUITECTURA
## 5509 5509 91.75 ARQUITECTURA
## 5510 5510 86.72 ARQUITECTURA
## 5511 5511 89.13 ARQUITECTURA
## 5512 5512 87.00 ARQUITECTURA
## 5513 5513 86.21 ARQUITECTURA
## 5514 5514 87.80 ARQUITECTURA
## 5515 5515 88.83 ARQUITECTURA
## 5516 5516 75.00 ARQUITECTURA
## 5517 5517 84.00 ARQUITECTURA
## 5518 5518 84.50 ARQUITECTURA
## 5519 5519 85.55 ARQUITECTURA
## 5520 5520 87.77 ARQUITECTURA
## 5521 5521 86.11 ARQUITECTURA
## 5522 5522 91.50 ARQUITECTURA
## 5523 5523 84.36 ARQUITECTURA
## 5524 5524 86.81 ARQUITECTURA
## 5525 5525 87.80 ARQUITECTURA
## 5526 5526 84.67 ARQUITECTURA
## 5527 5527 81.27 ARQUITECTURA
## 5528 5528 92.00 ARQUITECTURA
## 5529 5529 87.59 ARQUITECTURA
## 5530 5530 81.16 ARQUITECTURA
## 5531 5531 84.43 ARQUITECTURA
## 5532 5532 92.47 ARQUITECTURA
## 5533 5533 89.74 ARQUITECTURA
## 5534 5534 87.75 ARQUITECTURA
## 5535 5535 86.50 ARQUITECTURA
media <- mean(datos$Promedio)
media
## [1] 86.59522
Se determina la varianza de la variable Promedio del conjunto de datos.
La variable Promedio es una variable cuantitativa que se que significa el promedio de alumnos inscritos en una Institución Educativa. Siendo variable cuantitativa se puede aplicar medidas de dispersión.
varianza <- var(datos$Promedio)
varianza
## [1] 20.72146
Se determina la desviación estándar de la variable Promedio del conjunto de datos.
desviacion <- sd(datos$Promedio)
desviacion
## [1] 4.552083
CV <- desviacion / media * 100
CV
## [1] 5.256737
Se visualiza el diagrama de dispersión de todos los alumnos de todas las carreras en su variable Promedio.
titulo <- "Todos los alumnos"
subtitulo <- paste("Media=", round(media,2), " Varianza=",round(varianza,2)," Desv. Std.=",round(desviacion,2), " CV =", round(CV, 2),"%")
ggplot(data = datos, mapping = aes(x = X, y = Promedio)) +
geom_point(colour = "pink") +
geom_hline(yintercept = media, colour = "red") +
ggtitle(titulo, subtitle = subtitulo) +
xlab('Observaciones') + ylab('Promedios')
Se eligen tres carreras diferentes, TIC, MECATRONICA, INDUSTRIAL
datos.TIC <- subset(datos, Carrera == 'TIC')
head(datos.TIC)
## X.1 X NoControl Alumno Semestre Cr.Aprobados Cr.Cursando Promedio Carrera
## 387 387 387 1 1 14 230 15 79.12 TIC
## 388 388 388 2 2 10 235 10 82.96 TIC
## 389 389 389 3 3 10 215 15 83.26 TIC
## 390 390 390 4 4 10 183 14 82.28 TIC
## 391 391 391 5 5 12 199 36 79.21 TIC
## 392 392 392 6 6 2 26 30 88.83 TIC
media.TIC <- mean(datos.TIC$Promedio)
varianza.TIC <- var(datos.TIC$Promedio)
desviacion.TIC <- sd(datos.TIC$Promedio)
CV.TIC <- desviacion.TIC / media.TIC * 100
En a instrucción ggplot(data = datos.civil, mapping = aes(x = Alumno, y = Promedio)) se toma en el eje de las X el consecutivo de la variable Alumnos, que es desde 1 hasta el último alumno de cada carrera; y en el eje de las Y’s el Promedio.
titulo <- "Alumnos TIC"
subtitulo <- paste("Media=", round(media.TIC,2), " Varianza=",round(varianza.TIC,2)," Desv. Std.=",round(desviacion.TIC,2), " CV =", round(CV.TIC, 2),"%")
ggplot(data = datos.TIC, mapping = aes(x = Alumno, y = Promedio)) +
geom_point(colour = "purple") +
geom_hline(yintercept = media, colour = "red") +
ggtitle(titulo, subtitle = subtitulo) +
xlab('Observaciones') + ylab('Promedios')
datos.MECATRONICA <- subset(datos, Carrera == 'MECATRONICA')
head(datos.MECATRONICA)
## X.1 X NoControl Alumno Semestre Cr.Aprobados Cr.Cursando Promedio
## 2049 2049 2049 1 1 13 195 25 78.63
## 2050 2050 2050 2 2 12 229 6 80.46
## 2051 2051 2051 3 3 12 220 15 83.91
## 2052 2052 2052 4 4 10 235 10 92.45
## 2053 2053 2053 5 5 10 201 9 84.10
## 2054 2054 2054 6 6 11 189 36 83.03
## Carrera
## 2049 MECATRONICA
## 2050 MECATRONICA
## 2051 MECATRONICA
## 2052 MECATRONICA
## 2053 MECATRONICA
## 2054 MECATRONICA
media.MECATRONICA <- mean(datos.MECATRONICA$Promedio)
varianza.MECATRONICA <- var(datos.MECATRONICA$Promedio)
desviacion.MECATRONICA <- sd(datos.MECATRONICA$Promedio)
CV.MECATRONICA <- desviacion.MECATRONICA / media.MECATRONICA * 100
titulo <- "Alumnos MECATRONICA"
subtitulo <- paste("Media=", round(media.MECATRONICA,2), " Varianza=",round(varianza.MECATRONICA,2)," Desv. Std.=",round(desviacion.MECATRONICA,2), " CV =", round(CV.MECATRONICA, 2),"%")
ggplot(data = datos.MECATRONICA, mapping = aes(x = Alumno, y = Promedio)) +
geom_point(colour = "black") +
geom_hline(yintercept = media, colour = "red") +
ggtitle(titulo, subtitle = subtitulo) +
xlab('Observaciones') + ylab('Promedios')
datos.industrial <- subset(datos, Carrera == 'INDUSTRIAL')
head(datos.industrial)
## X.1 X NoControl Alumno Semestre Cr.Aprobados Cr.Cursando Promedio
## 2708 2708 2708 1 1 10 221 14 85.04
## 2709 2709 2709 2 2 15 224 6 76.45
## 2710 2710 2710 3 3 14 250 10 87.41
## 2711 2711 2711 4 4 10 235 10 79.83
## 2712 2712 2712 5 5 12 218 27 80.78
## 2713 2713 2713 6 6 11 158 15 79.92
## Carrera
## 2708 INDUSTRIAL
## 2709 INDUSTRIAL
## 2710 INDUSTRIAL
## 2711 INDUSTRIAL
## 2712 INDUSTRIAL
## 2713 INDUSTRIAL
media.industrial <- mean(datos.industrial$Promedio)
varianza.industrial <- var(datos.industrial$Promedio)
desviacion.industrial <- sd(datos.industrial$Promedio)
CV.industrial <- desviacion.industrial / media.industrial * 100
titulo <- "Alumnos Industrial"
subtitulo <- paste("Media=", round(media.industrial,2), " Varianza=",round(varianza.industrial,2)," Desv. Std.=",round(desviacion.industrial,2), " CV =", round(CV.industrial, 2),"%")
ggplot(data = datos.industrial, mapping = aes(x = Alumno, y = Promedio)) +
geom_point(colour = "coral") +
geom_hline(yintercept = media, colour = "red") +
ggtitle(titulo, subtitle = subtitulo) +
xlab('Observaciones') + ylab('Promedios')
ggplot(data = datos, mapping = aes(x = Alumno, y = Promedio, color = Carrera)) +
geom_point() +
facet_wrap(~ Carrera, nrow = 5)
pues, son aquellas que muestran la distancia de separacion de nuestros datos, esto nos sirve para que tengamos muestras de los datos mas cercanas a la media o si se alejan mucho al valor central y asi pues comparar distribuciones para la toma de deciciones, ya que a mayor crecania al centro, es mas representativo el valor central
la varianza es la representacion de una serie de datos respecto a su media (valor central). se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones, asi que se mide en unidades cuadradas
y en codigo r la varianza se determina con la funcion "var" tambien al parámetro x se indica la variable de interés para la cual se quiere calcular la varianza muestral, el parámetro "na.rm"" es un valor lógico que en caso de ser TRUE, significa que se deben remover las observaciones con NA, el valor por defecto para este parámetro es FALSE.
igualmente de la varianza hay dos maneras de calcular. La primera es la varianza muestral: \[ S^2=\frac{\sum_{i=1}^{i=n}(x_i-\bar{x})^2}{n-1}, \] que \(\bar{x}\) quiere decir el promedio muestral.
La varianza poblacional (\(\sigma^2\)) se define así:
\[ \sigma^2=\frac{\sum_{i=1}^{i=n}(x_i-\mu)^2}{n}, \]
donde \(\mu\) representa el promedio poblacional.
La desviación estándar es una medida de qué tanto se alejan llos datos de la media en relación al promedio y se mide en las mismas unidades de la variable de interés. Existen dos formas de calcular la desviación estándar dependiendo de si estamos trabajando con una muestra o con la población.
La desviación estándar muestral (\(S\)) para \(n\) observaciones se define así:`
\[ S=\sqrt{\frac{\sum_{i=1}^{i=n}(x_i-\bar{x})^2}{n-1}}, \] donde \(\bar{x}\) representa el promedio muestral.
La desviación estándar poblacional (\(\sigma\)) para \(n\)
observaciones se define así:
\[ \sigma=\sqrt{\frac{\sum_{i=1}^{i=n}(x_i-\mu)^2}{n}}, \] donde \(\mu\) representa el promedio de la población.
Para calcular en R la desviación muestral (\(S\)) de una variable cuantitativa se usa la función sd, los argumentos básicos de la función sd son dos y se muestran a continuación.
¿A qué se refiere el coeficiente de variación en un conjunto de datos? y ¿cómo se determina en R? es la relacion de el tamaño de la muestra y la media. el coeficiente de variación se define como \(CV=s/\bar{x}\) y con la función coef_var
De los datos alumnos de aquellos que tienen promedio superior a cero, ¿cuál es el valor de la media, de la varianza, de la desviación estándar y del coeficiente de variación de todos ellos conforme a la variable o columna Promedio?
valor de media: 86.6 . valor de la varianza: 20.72146 . desviación estándar:4.5 .coeficiente de variación:5.2%
TIC: CV= 5.05%
MECATRONICA: CV= 4.23%
INDUSTRIAL: CV= 5.08%
EL QUE TIENE MAYOR CV ES INDUSTRIAL, ESO SIGNIFICA QUE DE LAS TRES CARRERAS ES s LA QUE TIENE MAYOR TAMAÑO DE MUESTRA CON RESPECTO A LA MEDIA.A DE TODOS LOS ALUMNOS EN 86.6, ESTOS DATOS CON RESPECTO AL PROMEDIO, OSEA LA QUE MAS SE ACERCA.
EL QUE TIENE MENOR CV ES MECATRONICA, ESO SIGNIFICA QUE DE LAS TRES CARRERAS ES LA QUE TIENE MENOR TAMAÑO DE MUESTRA CON RESPECTO A LA MEDIA.A DE TODOS LOS ALUMNOS EN 86.6, ESTOS DATOS CON RESPECTO AL PROMEDIO, OSEA LA QUE MAS SE ALEJA..
PUES APRENDI SOBRE LAS MEDIDAS DE VARIACION, ESTAS CIRVEN PARA VER VARIEDADES ENTRE MUESTRAS DE POBLACION CON RESPECTO A LA MEDIA, AQUI VIMOS EJEMPLOS DE POBLACION DE ALUMNOS CON RESPECTO AL PROMEDIO Y CON SALARIOS DE EMPLEADOS.
SE ME OCURREN OTROS MEDIOS COMO SOBRE VENDER PROCUCTOS COMO PELUCHES Y CONTRASTAR LOS ANIMALES DE PELUCHE O PERSONAJES CON LOS MAS VENDIDOS, CON ESTO SE PUEDE MEDIR INDIVIDUALMENTE LA DEMANDA DE ESTOS O DICERNIR CUALES SON MAS FACTIBLES SEGUIR VENDIENDO, POR TEMPORADA O POR MES.
Anderson, David R., Dennis J. Sweeney, and Thomas A. Williams. 2008a. Estadística Para Administración y Economía. 10th ed. Australia • Brasil • Corea • España • Estados Unidos • Japón • México • Reino Unido • Singapur: Cengage Learning,. ———. 2008b. Estadística Para Administración y Economía. 10th ed. Australia Brasil Corea España Estados Unidos Japón México Reino Unido Singapur: Cengage Learning,. Devore, Jay L. 2016b. Fundamentos de Probabilidad y Estadística. Primera Edición. CENGAGE. ———. 2016a. Fundamentos de Probabilidad y Estadística. Primera Edición. CENGAGE.