Taller_IsabellaParedes.knit

title: “Estadistica 2” author: “Isabella Paredes” date: “2026-04-17” output: html_document

#TallerDeEstimacionesPorIntervaloDeConfianza

1.

Un analista financiero está evaluando el rendimiento diario de un portafolio de acciones. La desviación estándar histórica del rendimiento diario es de 15 puntos básicos (0.15%). En una muestra aleatoria de 25 días, el rendimiento medio observado fue de 100 puntos básicos (1.00%). El analista desea calcular un intervalo de confianza del 95% para el verdadero rendimiento medio diario del portafolio.

x_bar <- 100  
sigma <- 15   
n <- 25       
z_alpha <- 1.96  

error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:\n")

## Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:

cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") puntos básicos\n")

## ( 94.12 , 105.88 ) puntos básicos

Interpretacion: Esto significa que, a partir de los datos analizados, se puede afirmar con un 95% de confianza que el rendimiento promedio real de todo el portafolio se ubica entre 94.12 y 105.88. En otras palabras, ese intervalo representa el rango dentro del cual probablemente se encuentra la media verdadera del rendimiento del portafolio, por lo que se considera una estimación confiable del comportamiento general de los activos que lo componen.

2.

Un auditor desea hacer una estimación con un intervalo de confianza del 95% del valor promedio de los gastos diarios de una pequeña empresa. El auditor ha determinado que los valores diarios de los gastos están distribuidos normalmente.

x_bar <- 16500  
sigma <- 2000   
n <- 36         
z_alpha <- 1.96 
error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el valor promedio de los gastos diarios:\n")

## Intervalo de confianza del 95% para el valor promedio de los gastos diarios:

cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") dólares\n")

## ( 15846.67 , 17153.33 ) dólares

Interpretacion:Con un 95% de confianza, se puede decir que el promedio real de los gastos diarios de toda la población está dentro del intervalo comprendido entre 15846.67 y 17153.33. Es decir, con base en la información de la muestra, ese rango es el más probable para representar la media poblacional de los gastos diarios.

3.

Un analista de relaciones internacionales está evaluando el porcentaje de países en una muestra aleatoria que han incumplido acuerdos comerciales internacionales.

En una muestra aleatoria de 85 países, 10 han incurrido en incumplimientos de acuerdos comerciales.

El analista desea calcular un intervalo de confianza del 95% para la proporción de países en la población total que han incumplido acuerdos comerciales.

n <- 85   
x <- 10   
p_hat <- x / n  

z_critico <- qnorm(0.975)  

error_estandar <- sqrt((p_hat * (1 - p_hat)) / n)
IC <- c(p_hat - z_critico * error_estandar, p_hat + z_critico * error_estandar)

cat("Proporción muestral (p̂):", round(p_hat, 4), "\n")

## Proporción muestral (p̂): 0.1176

cat("Error estándar:", round(error_estandar, 4), "\n")

## Error estándar: 0.0349

cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")

## Intervalo de confianza (95%): 0.0492 a 0.1861

Con un nivel de confianza del 95%, se estima que la proporción real de países que incumplen los acuerdos se encuentra entre 0.0492 y 0.1861. En otras palabras, con base en los datos analizados, se puede afirmar que el porcentaje verdadero de países en incumplimiento probablemente está dentro de ese intervalo, lo que permite hacer una estimación estadísticamente confiable sobre este comportamiento.

4.

Se extrajeron dos muestras aleatorias independientes de estudiantes universitarios de estadística de sexo masculino y femenino.

De 120 hombres, 107 esperaban disfrutar de un trabajo de tiempo completo en un máximo de 6 años.
De 141 mujeres encuestadas, 73 tenían la misma expectativa.

El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las proporciones poblacionales.

Datos

Muestra de hombres: \(n_1 = 120\)

Hombres con expectativa de trabajo: \(x_1 = 107\)

Proporción muestral de hombres: \[ \hat{p}_1 = \frac{x_1}{n_1} \]

Muestra de mujeres: \(n_2 = 141\)

Mujeres con expectativa de trabajo: \(x_2 = 73\)

Proporción muestral de mujeres: \[ \hat{p}_2 = \frac{x_2}{n_2} \]

Nivel de confianza: \(95\%\)

Valor crítico: \(Z_{\alpha/2} = 1.96\)

Cálculo del Intervalo de Confianza

El intervalo de confianza para la diferencia de proporciones es:

\[ IC = (\hat{p}_1 - \hat{p}_2) \pm Z_{\alpha/2} \sqrt{\frac{\hat{p}_1(1 - \hat{p}_1)}{n_1} + \frac{\hat{p}_2(1 - \hat{p}_2)}{n_2}} \]

Donde:

\(Z_{\alpha/2} = 1.96\) para un 95% de confianza
\(\hat{p}_1\) y \(\hat{p}_2\) son las proporciones muestrales
\(n_1\) y \(n_2\) son los tamaños de muestra

n1 <- 120   
x1 <- 107   
p1_hat <- x1 / n1  
n2 <- 141   
x2 <- 73    
p2_hat <- x2 / n2  


diff_p <- p1_hat - p2_hat  


z_critico <- qnorm(0.975)  


error_estandar <- sqrt((p1_hat * (1 - p1_hat) / n1) + (p2_hat * (1 - p2_hat) / n2))


IC <- c(diff_p - z_critico * error_estandar, diff_p + z_critico * error_estandar)



cat("Proporción de hombres (p̂1):", round(p1_hat, 4), "\n")

## Proporción de hombres (p̂1): 0.8917

cat("Proporción de mujeres (p̂2):", round(p2_hat, 4), "\n")

## Proporción de mujeres (p̂2): 0.5177

cat("Diferencia de proporciones (p1 - p2):", round(diff_p, 4), "\n")

## Diferencia de proporciones (p1 - p2): 0.3739

cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")

## Intervalo de confianza (95%): 0.2745 a 0.4734

if (IC[1] > 0 & IC[2] > 0) {
  cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.\n")
} else {
  cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa entre hombres y mujeres y oscila entre 27% y 47%\n")
}

## Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.

Interpretacion: Dado que el valor 0 no está incluido dentro del intervalo de confianza, se concluye, con un nivel de confianza del 95%, que existe una diferencia significativa entre ambas proporciones. En este caso, la proporción de hombres que esperan trabajar tiempo completo en un plazo máximo de 6 años es mayor que la proporción de mujeres. Esto indica que la diferencia observada no parece deberse al azar, sino que refleja una diferencia real entre los dos grupos.

5.

Para una muestra aleatoria de 321 fumadores, el número medio de horas de absentismo laboral al mes fue de 3,01 horas, con una desviación típica muestral de 1,09 horas. Para una muestra aleatoria independiente de 94 trabajadores que nunca han fumado, el número medio de horas fue de 2,88 horas, con una desviación típica muestral de 1,01 horas. El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las dos medias poblacionales de absentismo laboral.

Datos

Muestra de fumadores: \(n_1 = 321\)
Media muestral: \(\bar{x}_1 = 3.01\)
Desviación estándar muestral: \(s_1 = 1.09\)

Muestra de no fumadores: \(n_2 = 94\)
Media muestral: \(\bar{x}_2 = 2.88\)
Desviación estándar muestral: \(s_2 = 1.01\)

Nivel de confianza: \(95\%\)
Valor crítico: \(Z_{\alpha/2} = 1.96\)

Cálculo del Intervalo de Confianza para la Diferencia de Medias

Dado que los tamaños muestrales son grandes, utilizamos la distribución normal estándar:

\[ IC = (\bar{x}_1 - \bar{x}_2) \pm Z_{\alpha/2} \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}} \]

Donde:

\(Z_{\alpha/2} = 1.96\) para un 95% de confianza
\(s_1^2\) y \(s_2^2\) son las varianzas muestrales
\(n_1\) y \(n_2\) son los tamaños de muestra

n1 <- 321   
x1_bar <- 3.01  
s1 <- 1.09  

n2 <- 94    
x2_bar <- 2.88  
s2 <- 1.01  


diff_means <- x1_bar - x2_bar  


z_critico <- qnorm(0.975)  


error_estandar <- sqrt((s1^2 / n1) + (s2^2 / n2))


IC <- c(diff_means - z_critico * error_estandar, diff_means + z_critico * error_estandar)



cat("Media de fumadores (x̄1):", round(x1_bar, 4), "\n")

## Media de fumadores (x̄1): 3.01

cat("Media de no fumadores (x̄2):", round(x2_bar, 4), "\n")

## Media de no fumadores (x̄2): 2.88

cat("Diferencia de medias (x̄1 - x̄2):", round(diff_means, 4), "\n")

## Diferencia de medias (x̄1 - x̄2): 0.13

cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")

## Intervalo de confianza (95%): -0.1064 a 0.3664

if (IC[1] > 0 & IC[2] > 0) {
  cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que los fumadores tienen un mayor absentismo laboral en promedio que los no fumadores.\n")
} else {
  cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.\n")
}

## Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.

Interpretacion: Como el valor 0 se encuentra dentro del intervalo de confianza, no se puede afirmar que exista una diferencia estadísticamente significativa entre las medias de ambas poblaciones. En otras palabras, con la información disponible no hay evidencia suficiente para rechazar la posibilidad de que las dos poblaciones tengan la misma media, por lo que la diferencia observada podría deberse al azar.