Importar base de datos

#file.choose()
poblacion<- read.csv("/Users/emilioolvera/Downloads/poblacion.csv")

#file.choose()
muestra<- read.csv("/Users/emilioolvera/Downloads/muestra.csv")

Tamaño de la población (N)

N <- length(poblacion$Pago)
N
## [1] 12

Tamaño de la muestra

n <- length(muestra$Pago)
n
## [1] 5

Medidas de tendencia central: Permiten conocer el valor que tiende el conjunto de datos.

Media o promedio: valor que se obtiene al sumar todos los datos y dividirlos entre la cantidad total de datos.

Media poblacional (x barra)

media_poblacional <- mean(poblacion$Pago)
media_poblacional
## [1] 245.0167

* Media muestral (miu)*

media_muestral <-mean(muestra$Pago)
media_muestral
## [1] 249.432

Mediana: valor que ocupa el lugar central de todos los datos cuando estos estan ordenados de menor a mayor.

mediana_poblacional <- median(poblacion$Pago)
mediana_poblacional
## [1] 228.63

Mediana muestral

mediana_muestral <- median(muestra$Pago)
mediana_muestral
## [1] 230.46

Moda: valor que aparece con mayor frecuencia en un conjunto de datos

Funcion para calcular la moda

mode <- function(x){
ux<- unique(x)
ux[which.max(tabulate(match(x,ux)))]
}

Nota: Si ningún dato se repite, la función coloca el primer valor en lugar de marcar error.

Moda poblacional

moda_poblacional<-mode(poblacion$Pago)
moda_poblacional
## [1] 266.63

Moda muestral

moda_muestral <- mode(muestra$Pago)
moda_muestral
## [1] 266.63

Relación entre la media, mediana y moda

Si la media = mediana = moda, los datos tiene una DISTRIBUCIÓN SIMÉTRICA.
Si la media < mediana < moda, los datos tienen SESGO NEGATIVO.
Si la moda <mediana <media, los datos tienen SESGO POSITIVO.

hist(poblacion$Pago)

La población tiene SESGO POSITIVO

Medidas de dispersion: miden que tan esparcidos se encuentran los datos
Rango: Intervalo o diferencia entre el valor máximo y el mínimo de un conjunto de datos

Rango poblacional

rango_poblacional <- max(poblacion$Pago)- min(poblacion$Pago)
rango_poblacional
## [1] 180.86
r <- range(poblacion$Pago)
r
## [1] 162.64 343.50

La funcion range () devuelve el valor mínimo y máximo pero no su diferencia, que es el valor que buscamos

rango_muestral <- max(muestra$Pago) - min(muestra$Pago)
rango_muestral
## [1] 156.34

Varianza: promedio al cuadrado de las desviaciones individuales de cada observación con respecto a la media de una distribución

Si es una población, se divide entre N; si es muestra, se divide entre n-1

Varianza poblacional (sigma cuadrada)

varianza_poblacional <- var(poblacion$Pago)*(N-1)/N
varianza_poblacional
## [1] 3614.659

Varianza muestral (s cuadrada)

varianza_muestral <- var(muestra$Pago)
varianza_muestral
## [1] 3570.905

Desviacion estandar: Raíz cuadrada de la varianza ## Desviacion estandar poblacional (sigma)

desviacion_estandar_poblacional <- sqrt(varianza_poblacional)
desviacion_estandar_poblacional
## [1] 60.12203

Desviación estándar muestral (s)

desviacion_estandar_muestral <- sqrt(varianza_muestral)
desviacion_estandar_muestral
## [1] 59.75705