Pregunta 1

Una empresa de tecnología quiere saber si la duración promedio de la batería de su nuevo modelo de teléfono móvil supera las 24 horas. Se sabe que la duración promedio de la batería de modelos anteriores es de 24 horas, y la desviación estándar poblacional es de 2 horas. Se selecciona una muestra aleatoria de 40 teléfonos del nuevo modelo y se registra la duración de la batería. La muestra arroja una duración media de 25 horas. Utilizando un nivel de significancia del 5 %, ¿existe suficiente evidencia para afirmar que la duración media de la batería del nuevo modelo es superior a las 24 horas? Realiza un z-test para responder esta pregunta.

Solución

  1. Identificamos parametros de interes El parámetro de interés en este caso es la duración promedio de la batería del nuevo modelo de teléfono móvil.

  2. Definir Hipotesis \(H_0\) : La duración promedio de la batería del nuevo modelo es igual a 24 horas. \[H_0: \mu = 24\]

    \(H_a\) : La duración promedio de la batería del nuevo modelo es mayor a 24 horas. \[H_a: \mu > 24\]

  3. Determinar y aplicar la prueba estadistica apropiada Dado que conocemos la desviación estándar poblacional, tenemos un tamaño mayor a 30 de la muestra y estamos interesados en la media de una población, un z-test es apropiado. En este caso, se utilizará un z-test de una cola, ya que estamos probando si la media es mayor a un cierto valor.

  4. Conclusión

    • Rechazamos \(H_0\) dado que el p-value es menor a 0.05(o cualquier nivel de significación típico), además el Z nos indica que la media de la muestra se desvia de la media poblacional hipotetica por lo tanto, hay evidencia estadistica para decir que la duración promedio de la bateria es distinta de 24 horas.
library(BSDA)
## Loading required package: lattice
## 
## Attaching package: 'BSDA'
## The following object is masked from 'package:datasets':
## 
##     Orange
set.seed(123) 
datos_muestra <- rnorm(n = 40, mean = 25, sd = 2) # 40 observaciones con media 25 y desviación estándar 2

# Realizar la prueba Z de dos colas
resultado <- z.test(datos_muestra,
                    mu = 24,
                    sigma.x = 2,
                    alternative = "greater")

# Mostrar el resultado
print(resultado)
## 
##  One-sample z-Test
## 
## data:  datos_muestra
## z = 3.448, p-value = 0.0002823
## alternative hypothesis: true mean is greater than 24
## 95 percent confidence interval:
##  24.57022       NA
## sample estimates:
## mean of x 
##  25.09037

Pregunta 2

Un restaurante introduce un nuevo plato y desea saber si el tiempo de preparación promedio de este plato es diferente del tiempo estándar de 30 minutos. El restaurante no tiene datos previos sobre la variabilidad del tiempo de preparación de este plato.Se toma una muestra de 25 preparaciones del nuevo plato, obteniendo un tiempo promedio de preparación de 32 minutos. Utilizando un nivel de significancia del 5 %, ¿existe suficiente evidencia para afirmar que el tiempo de preparación promedio del nuevo plato es diferente de 30 minutos?.CONSIDERAMOS DESVIACIÓN ESTÁNDAR MUESTRAL DE 5

Solución

  1. Identificamos parametros de interes El parámetro de interés aquí es el tiempo promedio de preparación del nuevo plato en el restaurante.

  2. Definir Hipotesis \(H_0\) : El tiempo promedio de preparación del nuevo plato es igual al tiempo estándar. \[H_0: \mu = 30 minutos\] \(H_a\): El tiempo promedio de preparación del nuevo plato es diferente al tiempo estándar. \[H_1: \mu \neq 30 minutos\]

  3. Determinar y aplicar la prueba estadistica apropiada Debido a que no conocemos la desviación estándar poblacional y estamos trabajando con una muestra de tamaño relativamente pequeño (n = 25), un t-test para una muestra es el más adecuado. Además, como queremos saber si el tiempo promedio es diferente (y no específicamente mayor o menor), utilizaremos un t-test de dos colas.
    Recordemos que :
    Para realizar un t-test, se deben cumplir ciertas condiciones:

    • La muestra debe ser aleatoria.
    • La muestra debe seguir aproximadamente una distribución normal. Dado que el tamaño de la muestra es menor a 30, esta suposición se vuelve más crítica. Sin embargo, en la ausencia de información contraria, se puede asumir normalidad para proceder con el análisis.
    • No conocemos la desviación estándar poblacional, pero tenemos la desviación estándar muestral.
  4. Conclusión

    • Dado los siguientes resultados, t = 1.9365, df = 24, p-value = 0.06467, donde t nos indica que la media muestral se desvia de la media poblacional hipotetica, pero el p-value es mayor a 0.05, por lo tanto, no hay evidencia estadistica para decir que la duración promedio de la preparación del plato es distinta de 30 minutos.
# Generamos muestra
set.seed(123) 
tiempos_preparacion <- rnorm(n = 25, mean = 32, sd = 5) 

# Realizar la prueba T
resultado_t_test <- t.test(tiempos_preparacion, 
                           mu = 30, 
                           alternative = "two.sided")

# Mostrar el resultado
print(resultado_t_test)
## 
##  One Sample t-test
## 
## data:  tiempos_preparacion
## t = 1.9365, df = 24, p-value = 0.06467
## alternative hypothesis: true mean is not equal to 30
## 95 percent confidence interval:
##  29.87939 33.78731
## sample estimates:
## mean of x 
##  31.83335

Pregunta 3

Una empresa de fabricación de neumáticos desea evaluar si el proceso de producción de neumáticos nuevos está bajo control en términos de variabilidad. La empresa tiene un estándar de calidad que establece que la variabilidad en el espesor de los neumáticos no debe exceder una varianza de 4 mm². Se toma una muestra aleatoria de 30 neumáticos y se mide el espesor de cada uno, resultando en una varianza muestral de 5 mm². Utilizando un nivel de significancia del 5 %, ¿existe suficiente evidencia para afirmar que la variabilidad en el proceso de producción es mayor que el estándar establecido?.

Solución

  1. Identificamos parametros de interes

El parámetro de interés en este caso es la variabilidad en el espesor de los neumáticos, específicamente la varianza.

  1. Definir Hipotesis \(H_0\) : La varianza en el espesor de los neumáticos es igual al valor especificado en el estándar de calidad. \[H_0: \sigma^2 = 4mm\] \(H_a\): La varianza en el espesor de los neumáticos es diferente al valor especificado en el estándar de calidad. \[H_1: \sigma^2 > 4mm\]

  2. Determinar y aplicar la prueba estadistica apropiada
    En este caso, como estamos interesados en probar si la variabilidad (varianza) de una población es mayor a un valor específico, utilizaremos la prueba de chi-cuadrado para una muestra. Esta prueba es apropiada cuando se conoce la varianza poblacional bajo la hipótesis nula y se desea compararla con la varianza muestral.
    Recordemos que para realizar una prueba de chi-cuadrado, se deben cumplir ciertas condiciones:

  • La muestra debe ser aleatoria.
  • La muestra debe ser lo suficientemente grande. Normalmente, se considera que un tamaño de muestra mayor a 30 es adecuado.
  • La variable bajo estudio (espesor de los neumáticos) debe seguir una distribución normal en la población.
  1. Conclusión
    • Dado los siguientes resultados, chi cuadrado = 36.25 que significa que la varianza muestral se aleja de la poblacional,y un p-value =0.166394504716496, significa que no hay suficiente evidencia para afirmar que la varianza en el espesor de los neumáticos es diferente del valor especificado en la hipótesis nula (4 mm²).
# Datos del problema
varianza_muestral_chi <- 5  # mm²
varianza_hipotetica_chi <- 4  # mm²
tamaño_muestra_chi <- 30

# Cálculo del valor de Chi-cuadrado
chi_cuadrado <- (tamaño_muestra_chi - 1) * varianza_muestral_chi / varianza_hipotetica_chi

# Realizar la prueba Chi-cuadrado
p_value_chi <- 1 - pchisq(chi_cuadrado, df = tamaño_muestra_chi - 1)

# Mostrar resultados
print(paste("Valor de Chi-cuadrado:", chi_cuadrado))
## [1] "Valor de Chi-cuadrado: 36.25"
print(paste("P-Value:", p_value_chi))
## [1] "P-Value: 0.166394504716496"

Pregunta 4

Una cadena de cines está interesada en aumentar la venta de palomitas de maíz. Un estudio previo mostró que aproximadamente el 40 % de los clientes compran palomitas. Tras implementar una nueva estrategia de marketing, la cadena desea saber si el porcentaje ha aumentado. Después de la implementación de la nueva estrategia, se selecciona una muestra aleatoria de 200 clientes, y se encuentra que 96 de ellos compraron palomitas de maíz. Utilizando un nivel de significancia del 5 %, ¿existe suficiente evidencia para afirmar que el porcentaje de clientes que compran palomitas ha aumentado?.

Solución

  1. Identificamos parametros de interes El parámetro de interés aquí es la proporción (\(\rho\)) de clientes que compran palomitas de maíz en la cadena de cines.

  2. Definir Hipotesis \(H_0\) : La proporción de clientes que compran palomitas es igual a 0.40. \[H_0: \rho = 0.40\] \(H_a\): La proporción de clientes que compran palomitas es mayor a 0.40. \[H_1: \rho > 0.40\]

  3. Determinar y aplicar la prueba estadistica apropiada En este caso, estamos interesados en probar un cambio en la proporción de una población. La prueba adecuada para esto es un test de proporciones, específicamente un z-test para una proporción.

    Debemos recordar que para realizar un z-test para proporciones, se deben cumplir ciertas condiciones:

    • La muestra debe ser aleatoria.

    • La muestra es lo suficientemente grande para que las aproximaciones de la distribución normal sean válidas. Esto generalmente se cumple si \(np \geq 5\) y \(n(1-p) \geq 5\)

  4. Conclusión

    • Dado los siguientes resultados, p-value = 0.01264, considerando un nivel de significación de 0.05, rechazamos la hipótesis nula, por lo tanto, hay evidencia estadistica para decir que la proporción de clientes que compran palomitas es mayor de 0.40.
# Datos del problema
n_clientes <- 200  # tamaño de la muestra
x_clientes <- 96   # número de éxitos
p0_clientes <- 0.40  # proporción hipotética

# Realizar el z-test para proporciones
resultado <- prop.test(x_clientes, n_clientes, p = p0_clientes, alternative = "greater")

# Mostrar resultados
print(resultado)
## 
##  1-sample proportions test with continuity correction
## 
## data:  x_clientes out of n_clientes, null probability p0_clientes
## X-squared = 5.0052, df = 1, p-value = 0.01264
## alternative hypothesis: true p is greater than 0.4
## 95 percent confidence interval:
##  0.4200931 1.0000000
## sample estimates:
##    p 
## 0.48

Pregunta 5

Una compañía de suplementos alimenticios está investigando el efecto de un nuevo producto en la mejora del rendimiento atlético. Se lleva a cabo un estudio con un grupo de deportistas para evaluar el impacto del suplemento. Un grupo de 15 deportistas participa en un experimento donde se mide su rendimiento en una prueba de resistencia. Se toman mediciones antes de iniciar el consumo del suplemento y después de cuatro semanas de uso continuo. Los investigadores están interesados en determinar si el consumo del suplemento ha tenido un efecto significativo en el rendimiento de los deportistas. Analiza los datos para proporcionar una respuesta a esta pregunta.

Solución

Indicadores para la Prueba de Wilcoxon en el Primer Enunciado 1. Datos Emparejados: Se menciona que se midió el rendimiento de los mismos deportistas antes y después de consumir el suplemento. Esto sugiere datos emparejados o medidas repetidas en los mismos sujetos.

  1. Comparación de Medidas Relacionadas: Se compara el rendimiento antes y después de una intervención (consumo del suplemento), indicando una comparación de dos condiciones relacionadas en el mismo grupo de sujetos.

  2. Ausencia de Suposición de Normalidad: Aunque no se menciona explícitamente, la prueba de Wilcoxon es una buena elección cuando no se puede asumir la normalidad de las diferencias, común en muestras pequeñas o datos no paramétricos.

  3. Parametro de interes

    • Parámetro poblacional: Diferencia en el rendimiento de los deportistas antes y después de consumir el suplemento(\(\mu\))
    • Valor hipotético; \(\mu_0\) = 0.
  4. Definir Hipotesis(no parametricas) \(H_0:\) No hay diferencia en el rendimiento de los deportistas antes y después de consumir el suplemento \(H_1:\) Hay diferencia en el rendimiento de los deportistas antes y después de consumir el suplemento

  5. Determinar y aplicar la prueba estadistica apropiada

    • Utilizaremos la prueba de Wilcoxon, ya que los datos son emparejados y no se puede asumir normalidad.
  6. Conclusión

  • Un valor de V cercano a 0 implica que las diferencias entre los pares están consistentemente a favor de una de las condiciones, el p-value es bastante bajo, por lo tanto, rechazamos la hipótesis nula, por lo tanto, hay evidencia estadistica para decir que la diferencia en el rendimiento de los deportistas antes y después de consumir el suplemento es distinta de 0. hay suficiente evidencia como para rechazar la Hipotesis nula
if (!require("exactRankTests")) {
    install.packages("exactRankTests", dependencies = TRUE)
}
## Loading required package: exactRankTests
##  Package 'exactRankTests' is no longer under development.
##  Please consider using package 'coin' instead.
library(exactRankTests)

rendimiento_antes <- c(20.5, 18.7, 21.3, 19.5, 22.1, 17.8, 20.0, 23.4, 21.5, 18.0, 19.2, 22.6, 17.9, 21.7, 20.3)
rendimiento_despues <- c(22.0, 19.1, 21.8, 20.0, 23.5, 18.2, 20.7, 25.1, 22.3, 18.5, 19.7, 23.0, 18.3, 22.2, 21.5)

resultado_wilcoxon <- wilcox.test(rendimiento_antes, rendimiento_despues, paired = TRUE)
## Warning in wilcox.test.default(rendimiento_antes, rendimiento_despues, paired =
## TRUE): cannot compute exact p-value with ties
print(resultado_wilcoxon)
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  rendimiento_antes and rendimiento_despues
## V = 0, p-value = 0.0006876
## alternative hypothesis: true location shift is not equal to 0

Pregunta 6

Un restaurante popular ha decidido modificar la receta de su plato estrella para hacerlo más saludable, cambiando algunos ingredientes para reducir el contenido de grasa. Para evaluar la aceptación de la nueva receta, el restaurante realiza una encuesta con 20 de sus clientes habituales que han probado tanto la versión original como la nueva del plato. Cada cliente indica si prefiere la versión original o la nueva. El restaurante necesita saber si la nueva receta es tan buena como la original según la percepción de los clientes. Examina los resultados de la encuesta para determinar si hay una preferencia clara por alguna de las dos versiones. Sugerencia : puede señalar en un arreglo la preferencia por un plato u otro, como un vector de valores binarios, es decir, c(1,0,1,1,0,…) y puede hacerlo aleatorio.

Solución

  1. Datos Binarios o de Categorías: Los clientes eligen entre dos opciones (versión original o nueva del plato). Esto sugiere datos categóricos binarios.

  2. Prueba de Preferencias o Elecciones: La prueba de signos es adecuada cuando se trata de comparar el número de preferencias en dos categorías, como en el caso de la elección entre dos versiones de un plato.

  3. No se Analiza la Magnitud de la Diferencia: La prueba de signos se enfoca en la dirección de la diferencia (preferencia por una versión sobre otra) más que en la magnitud de la diferencia, adecuada para los datos de este enunciado.

Para este caso podemos considerar dos contextos, primero : Cada cliente prueba ambas versiones del plato y expresa una preferencia por una de ellas. Esto crea un conjunto de datos pareados, donde cada par consiste en las preferencias de un cliente para ambas versiones. Y segundo : No son datos pareados

Para el siguiente desarrollo consideramos el primero:

  1. Parametro de interes
    • Parámetro poblacional: Preferencia de los clientes por la nueva versión del plato v/s la versión original
  2. Definir Hipotesis \(H_0:\) No hay diferencia en la preferencia de los clientes por la nueva versión del plato v/s la versión original
    \(H_1:\) Hay diferencia en la preferencia de los clientes por la nueva versión del plato v/s la versión original
  3. Determinar y aplicar la prueba estadistica apropiada
    • Utilizaremos la prueba de signos, ya que los datos son binarios y se quiere comparar la preferencia de los clientes por la nueva versión del plato v/s la versión original.
  4. Conclusión Considerando un p-value = 0.5034, no hay suficiente evidencia para rechazar la hipótesis nula, por lo tanto, no hay evidencia estadistica para decir que la preferencia de los clientes por la nueva versión del plato v/s la versión original es distinta
if (!require("BSDA")) {
    install.packages("BSDA", dependencies = TRUE)
}
library(BSDA)
preferencias <- c(1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 0, 1, 0)

# Realizar la prueba de signos
resultado_signos <- SIGN.test(preferencias, md = 0.5)

# Mostrar resultados
print(resultado_signos)
## 
##  One-sample Sign-Test
## 
## data:  preferencias
## s = 12, p-value = 0.5034
## alternative hypothesis: true median is not equal to 0.5
## 95 percent confidence interval:
##  0 1
## sample estimates:
## median of x 
##           1 
## 
## Achieved and Interpolated Confidence Intervals: 
## 
##                   Conf.Level L.E.pt U.E.pt
## Lower Achieved CI     0.8847      0      1
## Interpolated CI       0.9500      0      1
## Upper Achieved CI     0.9586      0      1