#file.choose()
poblacion<- read.csv("/Users/emilioolvera/Downloads/poblacion.csv")
#file.choose()
muestra<- read.csv("/Users/emilioolvera/Downloads/muestra.csv")
N <- length(poblacion$Pago)
N
## [1] 12
n <- length(muestra$Pago)
n
## [1] 5
Medidas de tendencia central: Permiten conocer el valor que tiende el conjunto de datos.
Media o promedio: valor que se obtiene al sumar todos los datos y dividirlos entre la cantidad total de datos.
media_poblacional <- mean(poblacion$Pago)
media_poblacional
## [1] 245.0167
media_muestral <-mean(muestra$Pago)
media_muestral
## [1] 249.432
mediana_poblacional <- median(poblacion$Pago)
mediana_poblacional
## [1] 228.63
mediana_muestral <- median(muestra$Pago)
mediana_muestral
## [1] 230.46
Moda: valor que aparece con mayor frecuencia en un conjunto de datos
mode <- function(x){
ux<- unique(x)
ux[which.max(tabulate(match(x,ux)))]
}
Nota: Si ningún dato se repite, la función coloca el primer valor en lugar de marcar error.
moda_poblacional<-mode(poblacion$Pago)
moda_poblacional
## [1] 266.63
moda_muestral <- mode(muestra$Pago)
moda_muestral
## [1] 266.63
Si la media = mediana = moda, los datos tiene una
DISTRIBUCIÓN SIMÉTRICA.
Si la media < mediana < moda, los datos tienen SESGO
NEGATIVO.
Si la moda <mediana <media, los datos tienen SESGO
POSITIVO.
hist(poblacion$Pago)
Medidas de dispersion: miden que tan esparcidos se encuentran
los datos
Rango: Intervalo o diferencia entre el valor máximo y el mínimo
de un conjunto de datos
rango_poblacional <- max(poblacion$Pago)- min(poblacion$Pago)
rango_poblacional
## [1] 180.86
r <- range(poblacion$Pago)
r
## [1] 162.64 343.50
La funcion range () devuelve el valor mínimo y máximo pero no su diferencia, que es el valor que buscamos
rango_muestral <- max(muestra$Pago) - min(muestra$Pago)
rango_muestral
## [1] 156.34
Varianza: promedio al cuadrado de las desviaciones individuales de cada observación con respecto a la media de una distribución
Si es una población, se divide entre N; si es muestra, se divide entre n-1
varianza_poblacional <- var(poblacion$Pago)*(N-1)/N
varianza_poblacional
## [1] 3614.659
varianza_muestral <- var(muestra$Pago)
varianza_muestral
## [1] 3570.905
Desviacion estandar: Raíz cuadrada de la varianza ## Desviacion estandar poblacional (sigma)
desviacion_estandar_poblacional <- sqrt(varianza_poblacional)
desviacion_estandar_poblacional
## [1] 60.12203
desviacion_estandar_muestral <- sqrt(varianza_muestral)
desviacion_estandar_muestral
## [1] 59.75705