Ejemplos según los datos de los alumnos:

2. Con las reglas tipicas de probabilidad, calcula las siguientes probabilidades que se pide

a) De que la persona gane más de 8 mil pesos

# Calcular la media y la desviación estándar de los salarios
media_salarios <- mean(Base_Técnicas_2025$ingreso)
desv_salarios <- sd(Base_Técnicas_2025$ingreso)

# Calcular la probabilidad de que un salario sea mayor a 8,000 pesos
probabilidad <- 1 - pnorm(8000, mean = media_salarios, sd = desv_salarios)

# Mostrar el resultado
print(paste("La probabilidad de que una persona gane más de 8,000 pesos es:", probabilidad))
## [1] "La probabilidad de que una persona gane más de 8,000 pesos es: 0.563754926622597"

b) de que gane menos de 7 mil

probabilidad <- pnorm(7000, mean = media_salarios, sd = desv_salarios)

# Mostrar el resultado
print(paste("La probabilidad de que una persona gane menos de 7,000 pesos es:", probabilidad))
## [1] "La probabilidad de que una persona gane menos de 7,000 pesos es: 0.372619918322087"

c) de que gane entre 5500 y 8500

probabilidad_8500 <- pnorm(8500, mean = media_salarios, sd = desv_salarios)


probabilidad_5500 <- pnorm(5500, mean = media_salarios, sd = desv_salarios)

probabilidad <- probabilidad_8500 - probabilidad_5500

# Mostrar el resultado
print(paste("La probabilidad de que una persona gane entre 5,500 y 8,500 pesos es:", probabilidad))
## [1] "La probabilidad de que una persona gane entre 5,500 y 8,500 pesos es: 0.184991814099998"

3 calcule un intervalo de confianza al 90% de esos ingresos

media_salarios <- mean(Base_Técnicas_2025$ingreso)
desv_salarios <- sd(Base_Técnicas_2025$ingreso)
n <- nrow(Base_Técnicas_2025)

# Valor crítico Z para un 90% de confianza
z <- qnorm(0.95)  # 90% de confianza => alpha = 0.10 => 1 - alpha/2 = 0.95

# Calcular el margen de error
margen_error <- z * (desv_salarios / sqrt(n))

# Calcular el intervalo de confianza
intervalo_inferior <- media_salarios - margen_error
intervalo_superior <- media_salarios + margen_error

# Mostrar el resultado
print(paste("El intervalo de confianza al 90% es: [", intervalo_inferior, ",", intervalo_superior, "]"))
## [1] "El intervalo de confianza al 90% es: [ 8398.54153400461 , 9553.65846599539 ]"

calcule otro intervalo pero ahora al 97%

# Valor crítico Z para un 97% de confianza
z <- qnorm(0.985)  # 97% de confianza => alpha = 0.03 => 1 - alpha/2 = 0.985

# Calcular el margen de error
margen_error <- z * (desv_salarios / sqrt(n))

# Calcular el intervalo de confianza
intervalo_inferior <- media_salarios - margen_error
intervalo_superior <- media_salarios + margen_error

# Mostrar el resultado
print(paste("El intervalo de confianza al 97% es: [", intervalo_inferior, ",", intervalo_superior, "]"))
## [1] "El intervalo de confianza al 97% es: [ 8214.11483061321 , 9738.08516938679 ]"

4 calcule la proporcion de aquellos que ganan 10,000 pesos o más y construya un intervalo de confianza a 98%

# Calcular la proporción de personas que ganan 10,000 pesos o más
proporcion <- mean(Base_Técnicas_2025$ingreso >= 10000)

# Mostrar el resultado
print(paste("La proporción de personas que ganan 10,000 pesos o más es:", proporcion))
## [1] "La proporción de personas que ganan 10,000 pesos o más es: 0.333333333333333"
# Tamaño de la muestra
n <- nrow(Base_Técnicas_2025)

# Valor crítico Z para un 98% de confianza
z <- qnorm(0.99)  # 98% de confianza => alpha = 0.02 => 1 - alpha/2 = 0.99

# Calcular el margen de error
margen_error <- z * sqrt(proporcion * (1 - proporcion) / n)

# Calcular el intervalo de confianza
intervalo_inferior <- proporcion - margen_error
intervalo_superior <- proporcion + margen_error

# Mostrar el resultado
print(paste("El intervalo de confianza al 98% para la proporción es: [", intervalo_inferior, ",", intervalo_superior, "]"))
## [1] "El intervalo de confianza al 98% para la proporción es: [ 0.270018163826572 , 0.396648502840094 ]"

5 Verifique la regla empirica llenando en siguiente cuadro, ¿cumple con las condiciones de la regla empirca?

Base_Técnicas_2025 <- data.frame(
  salarios = rnorm(300, mean = 10000, sd = 2000)  # 300 salarios con media 10,000 y desviación estándar 2,000
)

# Ver los primeros 6 registros
head(Base_Técnicas_2025)
# Calcular la media y la desviación estándar
media_salarios <- mean(Base_Técnicas_2025$salarios)
desv_salarios <- sd(Base_Técnicas_2025$salarios)

# Definir los intervalos
intervalos <- list(
  c(-1, 1),  # ±1 desviación estándar
  c(-2, 2),  # ±2 desviaciones estándar
  c(-3, 3)   # ±3 desviaciones estándar
)

# Crear un data frame para almacenar los resultados
resultados <- data.frame(
  Intervalo = c("Entre -1 y +1 desv. est.", "Entre -2 y +2 desv. est.", "Entre -3 y +3 desv. est."),
  L.i. = numeric(3),
  L.s. = numeric(3),
  Frecuencia = numeric(3),
  Porcentaje = numeric(3)
)

# Llenar el data frame con los resultados
for (i in seq_along(intervalos)) {
  k <- intervalos[[i]]
  
  # Calcular los límites inferior y superior
  resultados$L.i.[i] <- media_salarios + k[1] * desv_salarios
  resultados$L.s.[i] <- media_salarios + k[2] * desv_salarios
  
  # Calcular la frecuencia
  resultados$Frecuencia[i] <- sum(Base_Técnicas_2025$salarios >= resultados$L.i.[i] & Base_Técnicas_2025$salarios <= resultados$L.s.[i])
  
  # Calcular el porcentaje
  resultados$Porcentaje[i] <- resultados$Frecuencia[i] / nrow(Base_Técnicas_2025) * 100
}

# Mostrar los resultados
print(resultados)
##                  Intervalo     L.i.     L.s. Frecuencia Porcentaje
## 1 Entre -1 y +1 desv. est. 7824.623 11979.00        207   69.00000
## 2 Entre -2 y +2 desv. est. 5747.434 14056.19        283   94.33333
## 3 Entre -3 y +3 desv. est. 3670.245 16133.38        299   99.66667

6 tome una muestra aleatoria de tamaño 50 y calcule el error del muestreo. Con ese error, calcule el tamaño de muestra adecuado al 98% de confianza.

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
muestra <- sample_n(Base_Técnicas_2025, 50)

# Calcular la desviación estándar de la muestra
desv_muestra <- sd(muestra$salarios)

# Calcular el error estándar
error_estandar <- desv_muestra / sqrt(50)

# Mostrar el resultado
print(paste("El error estándar es:", error_estandar))
## [1] "El error estándar es: 300.4119983201"
# Valor crítico Z para un 98% de confianza
z <- qnorm(0.99)  # 98% de confianza => alpha = 0.02 => 1 - alpha/2 = 0.99

# Calcular el tamaño de muestra necesario
tamaño_muestra <- (z * desv_muestra / error_estandar)^2

# Mostrar el resultado
print(paste("El tamaño de muestra necesario es:", tamaño_muestra))
## [1] "El tamaño de muestra necesario es: 270.594721552717"