BD = base de datos
poblacion <- read.csv("/Users/ivannagarza/Desktop/TEC/7 SEMESTRE/poblacion.csv")muestra <- read.csv("/Users/ivannagarza/Desktop/TEC/7 SEMESTRE/muestra.csv")N <- length(poblacion$Pago)
N## [1] 12
n <- length(muestra$Pago)
n## [1] 5
Permiten conocer el valor al que tiende el conjunto de datos.
Media o Promedio: Valor que se obtiene al sumar todos los datos y dividirlos entre la cantidad total de datos
media_poblacional <- mean(poblacion$Pago)
media_poblacional## [1] 245.0167
media_muestral <- mean(muestra$Pago)
media_muestral## [1] 249.432
Valor que ocupa el lugar central de todos los datos cuando estos están ordenados de menor a mayor
mediana_poblacional<- median(poblacion$Pago)
mediana_poblacional ## [1] 228.63
mediana_muestral <- median(muestra$Pago)
mediana_muestral ## [1] 230.46
Valor que aparece con mayor frecuencia en un conjunto de datos.
mode <- function (x) {
ux <- unique(x)
ux [which.max(tabulate(match(x,ux)))]
}mode_poblacional <- mode(poblacion$Pago)
mode_poblacional## [1] 266.63
Nota: Si ningún dato se repite, la función coloca el primer valor en lugar de marcar error
mode_muestral <- mode(muestra$Pago)
mode_muestral## [1] 266.63
Si la media = mediana = moda, los datos tienen una DISTRIBUCION SIMETRICA. Si la media < mediana < moda, los datos tienen SESGO NEGATIVO. Si la moda < mediana < media, los datos tienen SESGO POSITIVO.
hist(poblacion$Pago)
La población tiene un SESGO POSITIVO
Miden que tan esparcidos se encuentran los datos
Intervalo o diferencia entre el valor máximo y el mínimo de un conjunto de datos
rango_poblacional <- max(poblacion$Pago) - min (poblacion$Pago)
rango_poblacional ## [1] 180.86
r<- range(poblacion$Pago)
r ## [1] 162.64 343.50
#La función range() devuelve el valor mínimo y máximo pero no su diferencia, que es el valor que buscamos
rango_muestral <- max(muestra$Pago) - min (muestra$Pago)
rango_muestral ## [1] 156.34
elevado al cuadrado de las desviaciones individuales de cada observación con respecto a la media de una distribución. Si es Población, se divide entre N, Si es mustra se divide entre (n-1)
varianza_poblacional <- var(poblacion$Pago)* (N-1)/N
varianza_poblacional## [1] 3614.659
varianza_muestral <- var(muestra$Pago)
varianza_muestral ## [1] 3570.905
Raíz cuadrada de la varianza
desviacion_estandar_poblacional <- sqrt(varianza_poblacional)
desviacion_estandar_poblacional## [1] 60.12203
desviacion_estandar_muestral <- sqrt(varianza_muestral)
desviacion_estandar_muestral## [1] 59.75705