Identificar BD

BD = base de datos

poblacion <- read.csv("/Users/ivannagarza/Desktop/TEC/7 SEMESTRE/poblacion.csv")
muestra <- read.csv("/Users/ivannagarza/Desktop/TEC/7 SEMESTRE/muestra.csv")

Realizar operaciones estadísticas

Tamaño de la población (N)

N <- length(poblacion$Pago)
N
## [1] 12

Tamaño de la muestra (n)

n <- length(muestra$Pago)
n
## [1] 5

Medidas de Tendencia Central

Permiten conocer el valor al que tiende el conjunto de datos.

Media o Promedio: Valor que se obtiene al sumar todos los datos y dividirlos entre la cantidad total de datos

Media Poblacional (x barra)

media_poblacional <- mean(poblacion$Pago)
media_poblacional
## [1] 245.0167

Media Muestral (miu)

media_muestral <- mean(muestra$Pago)
media_muestral
## [1] 249.432

Mediana

Valor que ocupa el lugar central de todos los datos cuando estos están ordenados de menor a mayor

Mediana Poblacional

mediana_poblacional<- median(poblacion$Pago)
mediana_poblacional    
## [1] 228.63

Mediana Muestral

mediana_muestral <- median(muestra$Pago)    
mediana_muestral    
## [1] 230.46

Moda

Valor que aparece con mayor frecuencia en un conjunto de datos.

mode <- function (x) {
      ux <- unique(x)
      ux [which.max(tabulate(match(x,ux)))]
    }

Moda Poblacional

mode_poblacional <- mode(poblacion$Pago)
mode_poblacional
## [1] 266.63

Nota: Si ningún dato se repite, la función coloca el primer valor en lugar de marcar error

Moda Muestra

mode_muestral <- mode(muestra$Pago)
mode_muestral
## [1] 266.63

Relación entre la media, mediana y moda

Si la media = mediana = moda, los datos tienen una DISTRIBUCION SIMETRICA. Si la media < mediana < moda, los datos tienen SESGO NEGATIVO. Si la moda < mediana < media, los datos tienen SESGO POSITIVO.

hist(poblacion$Pago)

La población tiene un SESGO POSITIVO

Medidas de Dispersión

Miden que tan esparcidos se encuentran los datos

Rango

Intervalo o diferencia entre el valor máximo y el mínimo de un conjunto de datos

Rango Poblacional

rango_poblacional <- max(poblacion$Pago) - min (poblacion$Pago)
rango_poblacional    
## [1] 180.86
r<- range(poblacion$Pago)    
r  
## [1] 162.64 343.50

#La función range() devuelve el valor mínimo y máximo pero no su diferencia, que es el valor que buscamos

rango_muestral <- max(muestra$Pago) - min (muestra$Pago)
rango_muestral  
## [1] 156.34

Varianza Promedio

elevado al cuadrado de las desviaciones individuales de cada observación con respecto a la media de una distribución. Si es Población, se divide entre N, Si es mustra se divide entre (n-1)

Varianza poblacional (Sigma cuadrada)

varianza_poblacional <- var(poblacion$Pago)* (N-1)/N
varianza_poblacional
## [1] 3614.659

Varianza Muestral (s cuadrada)

varianza_muestral <- var(muestra$Pago)
varianza_muestral    
## [1] 3570.905

Desviación Estandar

Raíz cuadrada de la varianza

Desviación estandar poblacional (sigma)

desviacion_estandar_poblacional <- sqrt(varianza_poblacional)
desviacion_estandar_poblacional
## [1] 60.12203

Desviación estandar poblacional (s)

desviacion_estandar_muestral <- sqrt(varianza_muestral)
desviacion_estandar_muestral
## [1] 59.75705

Conclusión