Taller 1

Ejercicios de Taller.

Distr Muestral de la Media

Muestras Grandes

Supongamos que el incremento porcentual en los precios de lacteos en la zona norte de Colombia se distribuye siguiendo una normal con media del \(8.76\%\) y desviación típica de \(2.4\%\). Se toma una muestra aleatoria de \(n = 27\) observaciones de diferentes productos lacteos de incrementos porcentuales en los precios de esta zona. Se desea calcular la probabilidad de que la media muestral sea mayor al \(5\%\).

 # Datos del problema
media_poblacional <- 8.76  
desviacion_estandar <- 2.4  
tamano_muestra <- 27  
media_muestral_objetivo <- 5  

# Error estándar de la media
error_estandar <- desviacion_estandar / sqrt(tamano_muestra)

# Estadístico z
z_estadistico <- (media_muestral_objetivo - media_poblacional) / error_estandar

# Probabilidad (valor p)
p_valor <- pnorm(z_estadistico, lower.tail = FALSE)

# Resultados
print(paste("Error estándar:", error_estandar))

## [1] "Error estándar: 0.461880215351701"

print(paste("Estadístico z:", z_estadistico))

## [1] "Estadístico z: -8.14063879557372"

print(paste("Valor p:", p_valor))

## [1] "Valor p: 1"

Muestras Pequeñas

**Análisis del Tiempo de Resolución de Solicitudes en un Centro de Atención al Cliente

Una empresa desea evaluar el tiempo de resolución de solicitudes en su centro de atención al cliente. Se sabe que los tiempos de resolución siguen una distribución normal, con una media poblacional de 15 días y una desviación estándar muestral de 3 días.

Para analizar el rendimiento del sistema, se selecciona una muestra aleatoria de n = 9 solicitudes resueltas. Se desea calcular la probabilidad de que la media muestral de los tiempos de resolución sea estrictamente mayor que 16.5 días.**

# Datos del problema
media_poblacional <- 15
desviacion_estandar <- 3
tamano_muestra <- 9
media_muestral_objetivo <- 16.5

# Error estándar de la media
error_estandar <- desviacion_estandar / sqrt(tamano_muestra)

# Estadístico t
t_estadistico <- (media_muestral_objetivo - media_poblacional) / error_estandar

# Grados de libertad
grados_libertad <- tamano_muestra - 1

# Probabilidad (valor p)
p_valor <- 1 - pt(t_estadistico, df = grados_libertad)

# Resultados
print(paste("Error estándar:", error_estandar))

## [1] "Error estándar: 1"

print(paste("Estadístico t:", t_estadistico))

## [1] "Estadístico t: 1.5"

print(paste("Grados de libertad:", grados_libertad))

## [1] "Grados de libertad: 8"

print(paste("Valor p:", p_valor))

## [1] "Valor p: 0.0860016459759556"

Distribucion diferencia de medias caso 1

**Supongamos que se está realizando un estudio para comparar dos métodos de entrenamiento (X e Y) con el objetivo de reducir el tiempo en el que los atletas completan una carrera de 100 metros. El investigador sabe que los tiempos de los corredores en cada grupo siguen una distribución normal.

Se implementa el método X en un grupo de 35 atletas y el método Y en un grupo de 45 atletas.

Tras completar el programa de entrenamiento, el tiempo promedio de los corredores con el método X es de 12.8 segundos con una desviación estándar de 0.6 segundos, mientras que el tiempo promedio de los corredores con el método Y es de 11.5 segundos con una desviación estándar de 0.8 segundos. Se desea calcular la probabilidad de que la diferencia en el tiempo promedio entre los métodos X e Y en los atletas sea menor o igual a la observada en el estudio.**

# Datos del estudio
n1 <- 35
media1 <- 12.8
sd1 <- 0.6

n2 <- 45
media2 <- 11.5
sd2 <- 0.8

# Diferencia observada en las medias
diferencia_observada <- media1 - media2

# Error estándar de la diferencia
error_estandar <- sqrt((sd1^2 / n1) + (sd2^2 / n2))

# Estadístico t
t_estadistico <- diferencia_observada / error_estandar

# Grados de libertad (aproximación de Welch-Satterthwaite)
grados_libertad <- ( (sd1^2 / n1) + (sd2^2 / n2) )^2 / ( ((sd1^2 / n1)^2 / (n1 - 1)) + ((sd2^2 / n2)^2 / (n2 - 1)) )

# Probabilidad (valor p)
p_valor <- pt(t_estadistico, df = grados_libertad)

# Resultados
print(paste("Diferencia observada:", diferencia_observada))

## [1] "Diferencia observada: 1.3"

print(paste("Error estándar:", error_estandar))

## [1] "Error estándar: 0.156550108616815"

print(paste("Estadístico t:", t_estadistico))

## [1] "Estadístico t: 8.304050450594"

print(paste("Grados de libertad:", grados_libertad))

## [1] "Grados de libertad: 77.9167538242121"

print(paste("Valor p:", p_valor))

## [1] "Valor p: 0.999999999998781"

Distribucion diferencia de medias caso 2

**En un estudio experimental se busca comparar dos métodos de entrenamiento (X e Y) para evaluar su efecto en la reducción del tiempo en el que los atletas completan una carrera de 100 metros. Sin embargo, se sabe que los tiempos de los corredores no siguen una distribución normal en la población.

Se implementa el método X en un grupo de 8 atletas y el método Y en un grupo de 9 atletas.

# Datos del estudio
n1 <- 8
media1 <- 12.8
sd1 <- 0.6

n2 <- 9
media2 <- 11.5
sd2 <- 0.8

# Diferencia observada en las medias
diferencia_observada <- media1 - media2

# Varianza combinada (pooled variance)
varianza_combinada <- ((n1 - 1) * sd1^2 + (n2 - 1) * sd2^2) / (n1 + n2 - 2)

# Error estándar de la diferencia (usando la varianza combinada)
error_estandar <- sqrt(varianza_combinada / n1 + varianza_combinada / n2)

# Estadístico t
t_estadistico <- diferencia_observada / error_estandar

# Grados de libertad
grados_libertad <- n1 + n2 - 2

# Probabilidad (valor p)
p_valor <- pt(t_estadistico, df = grados_libertad)

# Resultados
print(paste("Diferencia observada:", diferencia_observada))

## [1] "Diferencia observada: 1.3"

print(paste("Error estándar:", error_estandar))

## [1] "Error estándar: 0.346784168120835"

print(paste("Estadístico t:", t_estadistico))

## [1] "Estadístico t: 3.74872938128774"

print(paste("Grados de libertad:", grados_libertad))

## [1] "Grados de libertad: 15"

print(paste("Valor p:", p_valor))

## [1] "Valor p: 0.999032010088566"

Taller 1

Alexis De la Cruz, Eduardo Quintero, Hugo Jimenez

2025-02-12

Ejercicios de Taller.