importarbasededatos

#file.choose()

poblacion <- read.csv("/Users/lizmanzano/Desktop/poblacion.csv")

#file.choose()

muestra <- read.csv("/Users/lizmanzano/Desktop/muestra.csv")

Tamaño de Población

N <- length(poblacion$Pago)
N
## [1] 12

Tamaño de muestra

n <- length(muestra$Pago)
n
## [1] 5

Medidas de Tendencia Central: Permiten conocer el valor al que tiende el conjunto de datos.

Media o Promedio: Valor que se obtiene al sumar todos los datos y dividirlos entre la cantidad total de datos.

Media Poblacional (x barra)

media_poblacional <- mean(poblacion$Pago)
media_poblacional
## [1] 245.0167

Media Muestral (miu)

media_muestral <- mean(muestra$Pago)
media_muestral  
## [1] 249.432

Mediana: Valor que ocupa el llugar central de todos los datos cuando estos están ordenados de menor a mayor.

Mediana Poblacional

mediana_poblacional <- median(poblacion$Pago)
mediana_poblacional  
## [1] 228.63

Mediana Muestra

mediana_muestral <- median(muestra$Pago)
mediana_muestral 
## [1] 230.46

Moda: Valor que aparece con mayor frecuencia en un conjunto de datos.

Función para calcular la Moda

mode <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

Nota: Si ningún dato se repite, la función coloca el primer valor en lugar de marcar error

Moda Poblacional

moda_poblacional <- mode(poblacion$Pago)
moda_poblacional    
## [1] 266.63

Moda Muestral

moda_muestral <- mode(muestra$Pago)
moda_muestral  
## [1] 266.63

Relación entre la media, mediana y moda

Si la media = mediana = moda, los datos tienen una DISTRIBUCIÓN SIMÉTRICA.

Si la media < mediana < moda, los datos tienen SESGO NEGATIVO (IZQUIERDA).

Si la moda < mediana < media, los datos tienen SESGO POSITIVO (DERECHA).

hist(poblacion$Pago)

## La población tiene SESGO POSITIVO.

Medidas de Dispersión: Miden qué tan esparcidos se encuentran los datos.

Rango : Intervalo o diferencia entre el valor máximo y el mínimo de un conjunto de datos.

Rango Poblacional

rango_poblacional <- max(poblacion$Pago - min(poblacion$Pago))
rango_poblacional      
## [1] 180.86
r <- range(poblacion$Pago)      
r  
## [1] 162.64 343.50

La función range() devuelve el valor minimo y máximo, pero no su diferencia, que es el valor que buscamos

rango_muestral <- max(muestra$Pago - min(muestra$Pago))
rango_muestral 
## [1] 156.34

Varianza: Promedio elevado al cuadrado de las desvaciones individuales de cada observación con respecto a la media de una distribución.

Si es Población, se divide entre N; si es Muestra, si divide entre n-1.

Varianza Poblacional (sigma cuadrada)

varianza_poblacional <- var(poblacion$Pago)*(N-1)/N
varianza_poblacional
## [1] 3614.659

Varianza Muestral (s cuadrada)

varianza_muestral <- var(muestra$Pago)
varianza_muestral 
## [1] 3570.905

Desviación Estándar: Raíz cuadrada de la varianza

Desviación Estándar Poblacional (sigma)

desviacion_estandar_poblacional <- sqrt(varianza_poblacional)
desviacion_estandar_poblacional    
## [1] 60.12203

Desviación Estándar Muestral (s) ## Desviación Estándar Muestral (s)

desviacion_estandar_muestral <- sqrt(varianza_muestral)
desviacion_estandar_muestral
## [1] 59.75705