Pruebas de Hipótesis para la Media y Proporción.

1. Eres un analista financiero en una empresa de inversiones y te han pedido evaluar si el rendimiento de un fondo de inversión específico es significativamente diferente al rendimiento promedio del mercado. La media del mercado es 5.

\(H_{0}: \mu = 5\)

\(H_{1}: \mu\) es diferente de \(5\)

Inversiones <- c(1,2,3,4,5,6,7,8,9,10)
Rendimiento <-c(4.2, 5.6, 3.9, 6.7, 4.8,5.2, 6.0,4.4, 5.9,3.7)

df <- data.frame(Inversiones,Rendimiento)
df
##    Inversiones Rendimiento
## 1            1         4.2
## 2            2         5.6
## 3            3         3.9
## 4            4         6.7
## 5            5         4.8
## 6            6         5.2
## 7            7         6.0
## 8            8         4.4
## 9            9         5.9
## 10          10         3.7
t.test(df$Rendimiento, alternative = "two.sided", mu = 5)
## 
##  One Sample t-test
## 
## data:  df$Rendimiento
## t = 0.12632, df = 9, p-value = 0.9023
## alternative hypothesis: true mean is not equal to 5
## 95 percent confidence interval:
##  4.32369 5.75631
## sample estimates:
## mean of x 
##      5.04

Si el p-valor es menor o igual a la significancia (0.05), entonces se rechaza la hipotesis nula que indica que el proemdio es 5.

En este caso como el p-valor es 0.9023 entonces, NO SE RECHAZA LA HO, SINO QUE SE ACEPTA.

2 Se desea saber si la proporción de inversiones exitosas (aquellas que superan un rendimiento del 5%) en el fondo, son significativamente diferente a la proporción del mercado. La proporcion del mercado esta en 60%.

\(H_{0}: p = 60\%\)

$H_{1}: p $ es diferente de \(60\%\)

n<- length(df$Rendimiento)
inversiones_exitosas <- sum(df$Rendimiento >= 5)
p <- inversiones_exitosas / n
prop.test( inversiones_exitosas, n, 0.60, "two.sided")
## Warning in prop.test(inversiones_exitosas, n, 0.6, "two.sided"): Chi-squared
## approximation may be incorrect
## 
##  1-sample proportions test with continuity correction
## 
## data:  inversiones_exitosas out of n, null probability 0.6
## X-squared = 0.10417, df = 1, p-value = 0.7469
## alternative hypothesis: true p is not equal to 0.6
## 95 percent confidence interval:
##  0.201423 0.798577
## sample estimates:
##   p 
## 0.5

3. Un contador quiere comparar la proporción de clientes que cumplen con sus pagos a tiempo en dos sucursales de una cadena de tiendas para determinar si hay una diferencia significativa entre ellas.

Datos: Sucursal A: 80 de 150 clientes cumplen con sus pagos a tiempo. Sucursal B: 70 de 130 clientes cumplen con sus pagos a tiempo. Nivel de significancia: 0.05.

\(H_{0}: P_{A} = P_{B}\)

\(H_{1}: \quad P_{A} \neq P_{B}\)

# Datos
cumplen_A <- 80
total_A <- 150

cumplen_B <- 70
total_B <- 130

# Proporciones
p_A <- cumplen_A / total_A
p_B <- cumplen_B / total_B

# Proporción combinada
p_comb <- (cumplen_A + cumplen_B) / (total_A + total_B)

# Estadístico z de la prueba
z_value <- (p_A - p_B) / sqrt(p_comb * (1 - p_comb) * (1 / total_A + 1 / total_B))

# Nivel de significancia
alfa <- 0.05

# Valor crítico z para un intervalo de confianza de 95%
z_critico <- qnorm(1 - alfa / 2)

# Valor p
p_value <- 2 * (1 - pnorm(abs(z_value)))

# Resultados
cat("Estadístico z:", z_value, "\n")
## Estadístico z: -0.08581128
cat("Valor crítico z:", z_critico, "\n")
## Valor crítico z: 1.959964
cat("Valor p:", p_value, "\n")
## Valor p: 0.9316164
# Decisión
if (p_value < alfa) {
  cat("Rechazamos la hipótesis nula. Hay una diferencia significativa en la proporción de clientes que cumplen con sus pagos a tiempo entre las dos sucursales.\n")
} else {
  cat("No rechazamos la hipótesis nula. No hay una diferencia significativa en la proporción de clientes que cumplen con sus pagos a tiempo entre las dos sucursales.\n")
}
## No rechazamos la hipótesis nula. No hay una diferencia significativa en la proporción de clientes que cumplen con sus pagos a tiempo entre las dos sucursales.

4. Un contador quiere comparar los ingresos medios anuales de dos sucursales de una cadena de tiendas para determinar si hay una diferencia significativa entre ellas.

Datos:

Sucursal A: Muestra de 25 ingresos anuales con media de $250,000 y desviación estándar de $30,000. Sucursal B: Muestra de 20 ingresos anuales con media de $240,000 y desviación estándar de $28,000. Nivel de significancia: 0.05.

media_A <- 250000
desv_est_A <- 30000
n_A <- 25

media_B <- 240000
desv_est_B <- 28000
n_B <- 20

# Niveles de significancia y grados de libertad
alfa <- 0.05

# Estadístico t de la prueba
t_value <- (media_A - media_B) / sqrt((desv_est_A^2 / n_A) + (desv_est_B^2 / n_B))

# Grados de libertad aproximados (Satterthwaite's approximation)
df <- (((desv_est_A^2 / n_A) + (desv_est_B^2 / n_B))^2) / 
      (((desv_est_A^2 / n_A)^2 / (n_A - 1)) + ((desv_est_B^2 / n_B)^2 / (n_B - 1)))

# Valor crítico t para un intervalo de confianza de 95%
t_critico <- qt(1 - alfa / 2, df)

# Valor p
p_value <- 2 * pt(-abs(t_value), df)

# Resultados
cat("Estadístico t:", t_value, "\n")
## Estadístico t: 1.153164
cat("Grados de libertad:", df, "\n")
## Grados de libertad: 41.92776
cat("Valor crítico t:", t_critico, "\n")
## Valor crítico t: 2.018185
cat("Valor p:", p_value, "\n")
## Valor p: 0.2553749
# Decisión
if (p_value < alfa) {
  cat("Rechazamos la hipótesis nula. Hay una diferencia significativa en los ingresos medios anuales entre las dos sucursales.\n")
} else {
  cat("No rechazamos la hipótesis nula. No hay una diferencia significativa en los ingresos medios anuales entre las dos sucursales.\n")
}
## No rechazamos la hipótesis nula. No hay una diferencia significativa en los ingresos medios anuales entre las dos sucursales.

5. Un administrador quiere comparar la variabilidad en los tiempos de entrega de dos proveedores para determinar si hay una diferencia significativa en la consistencia de sus servicios.

Datos:

Proveedor A: Muestra de 20 tiempos de entrega con varianza de 16 días. Proveedor B: Muestra de 25 tiempos de entrega con varianza de 9 días. Nivel de significancia: 0.05.

varianza_A <- 16
n_A <- 20

varianza_B <- 9
n_B <- 25

# Estadístico F de la prueba
f_value <- varianza_A / varianza_B

# Grados de libertad
df1 <- n_A - 1
df2 <- n_B - 1

# Nivel de significancia
alfa <- 0.05

# Valor crítico F para un intervalo de confianza de 95%
f_critico_inf <- qf(alfa / 2, df1, df2)
f_critico_sup <- qf(1 - alfa / 2, df1, df2)

# Valor p
p_value <- 2 * min(pf(f_value, df1, df2), 1 - pf(f_value, df1, df2))

# Resultados
cat("Estadístico F:", f_value, "\n")
## Estadístico F: 1.777778
cat("Grados de libertad:", df1, "y", df2, "\n")
## Grados de libertad: 19 y 24
cat("Intervalo crítico F:", f_critico_inf, "a", f_critico_sup, "\n")
## Intervalo crítico F: 0.407777 a 2.345154
cat("Valor p:", p_value, "\n")
## Valor p: 0.1828287
# Decisión
if (p_value < alfa) {
  cat("Rechazamos la hipótesis nula. Hay una diferencia significativa en la variabilidad de los tiempos de entrega entre los dos proveedores.\n")
} else {
  cat("No rechazamos la hipótesis nula. No hay una diferencia significativa en la variabilidad de los tiempos de entrega entre los dos proveedores.\n")
}
## No rechazamos la hipótesis nula. No hay una diferencia significativa en la variabilidad de los tiempos de entrega entre los dos proveedores.