Laboratorio 4

Author

Roberto Trespalacios

Published

February 22, 2024

Problemas de práctica

  1. Para la variable Estatura de los datos estudiantes.csv, realizar los siguientes ejercicios en R.
    1. Cargar los datos estudiantes.csv a Rstudio.
    2. Crear una tabla de frecuencias con 6 clases, que contenga: frecuencias absolutas, frecuencias acumuladas, marca de clase y límites inferior y superior.
    3. Encontrar la media.
    4. Encontrar la mediana y luego interprete el valor.
  2. Usando la tabla del inciso 1b, realizar los siguientes ejercicios en R.
    1. Encuentre la media de los datos agrupados.
    2. Encuentre la mediana de los datos agrupados y luego interprete el valor.
    3. Encuentre la moda de los datos agrupados y luego interprete el valor.

1a. Cargar los datos estudiantes.csv a Rstudio.

Code
#lectura de los datos
library(readr)
estudiantes <- read_csv("estudiantes.csv")

1b. Crear una tabla de frecuencias con 6 clases, que contenga: frecuencias absolutas, frecuencias acumuladas, marca de clase y límites inferior y superior.

Code
# tabla de frecuencia
x = estudiantes$estatura

# maximo y minimo  de los datos
xmax = max(x)
xmin = min(x)

# ancho de los intervalos
ancho = 5

# limites inf y sup de cada intervalo
cortes = seq(from = 160, to = 190, by = ancho)

#encontramos el intervalo al cual pertenece cada dato
interv = cut(x, include.lowest = TRUE, right = FALSE, breaks = cortes)

# frecuencia de cada intervalo
frec_basica = table(interv)

# tabla de frecuencia basica
tabla = data.frame(frec_basica)

# agregamos otras columnas
tabla$F = cumsum(tabla$Freq)
tabla$xi = cortes[1:(length(cortes)-1)] + ancho/2
tabla$linf = cortes[1:(length(cortes)-1)]
tabla$lsup = cortes[2:length(cortes)]

#Cambiamos los nombres de la tabla 
names(tabla)[1] <- "Clase"
names(tabla)[2] <- "f"

# veamos la tabla
tabla

1c. Encontrar la media.

Code
# media de datos no agrupados
mean(estudiantes$estatura)

1d. Encontrar la mediana y luego interprete el valor.

Code
# mediana de datos no agrupados
median(estudiantes$estatura)
Interpretación:

2a. Encuentre la media de los datos agrupados.

Code
n = length(x)

# media de datos agrupados
sum(tabla$f*tabla$xi)/n

2b. Encuentre la mediana de los datos agrupados y luego interprete el valor.

Code
i = which(tabla$F>n/2)[1]
Li = tabla$linf[i]
Ls = tabla$lsup[i]
Fimenos1 = tabla$F[i]
fi = tabla$f[i+1]

# mediana de datos agrupados
Li + (Ls-Li)*((n/2 - Fimenos1)/fi)
Interpretación:

2c. Encuentre la moda de los datos agrupados y luego interprete el valor.

Code
i = which.max(tabla$f)
Li = tabla$linf[i]
Ls = tabla$lsup[i]
fimas1 = tabla$f[i+1]
fimenos1 = tabla$f[i-1]

# moda de datos agrupados
Li + (Ls-Li)*(fimas1/(fimenos1 + fimas1))
Interpretación: