Este ejercicio está relacionado con un contraste de hipótesis sobre la independencia entre dos variables categóricas: la preferencia de marca y la región geográfica. Para resolver este problema, se utilizará la prueba de independencia de chi-cuadrado.
Plantear las hipótesis
Tabla de contingencia observada
La tabla observada de frecuencias es:
\[ \begin{array}{|c|c|c|c|c|} \hline \text{Marca} & \text{Sur} & \text{Centro} & \text{Norte} & \text{Total} \\ \hline A & 40 & 52 & 25 & 117 \\ B & 52 & 70 & 35 & 157 \\ C & 68 & 78 & 60 & 206 \\ \hline \text{Total} & 160 & 200 & 120 & 480 \\ \hline \end{array} \]
Tabla de frecuencias esperadas
Para calcular las frecuencias esperadas bajo la hipótesis de independencia, usamos la fórmula:
\[ E_{ij} = \frac{\text{Fila}_i \times \text{Columna}_j}{\text{Total general}} \]
Por ejemplo, la frecuencia esperada para la marca A en la región Sur es:
\[ E_{A, \text{Sur}} = \frac{117 \times 160}{480} = \frac{18720}{480} = 39 \]
Repetimos este cálculo para todos los valores de la tabla:
\[ \begin{array}{|c|c|c|c|} \hline \text{Marca} & \text{Sur} & \text{Centro} & \text{Norte} \\ \hline A & 39 & 48.75 & 29.25 \\ B & 52.33 & 65.42 & 39.25 \\ C & 68.67 & 85.83 & 51.5 \\ \hline \end{array} \]
Estadístico de prueba \(\chi^2\)
El estadístico de prueba se calcula usando la fórmula:
\[ \chi^2 = \sum \frac{(O_{ij} - E_{ij})^2}{E_{ij}} \]
donde \(O_{ij}\) son las frecuencias observadas y \(E_{ij}\) las frecuencias esperadas.
Para cada celda, calculamos el término:
\[ \frac{(O_{ij} - E_{ij})^2}{E_{ij}} \]
Ejemplo para la primera celda (A, Sur):
\[ \frac{(40 - 39)^2}{39} = \frac{1}{39} \approx 0.0256 \]
Repetimos este cálculo para todas las celdas de la tabla. A continuación, se muestra la suma de todos los términos:
\[ \chi^2 \approx 4.1 \]
Grados de libertad
El número de grados de libertad para esta prueba es:
\[ \text{gl} = (\text{Número de filas} - 1) \times (\text{Número de columnas} - 1) = (3 - 1) \times (3 - 1) = 4 \]
Valor crítico y decisión
Para un nivel de significancia \(\alpha = 0.05\), buscamos el valor crítico en la tabla de chi-cuadrado para 4 grados de libertad:
\[ \chi^2_{\alpha=0.05, gl=4} \approx 9.488 \]
Como \(\chi^2 = 4.1\) es menor que \(9.488\), no rechazamos la hipótesis nula.
Valor-p
El valor-p correspondiente al estadístico de chi-cuadrado de 4.1 con 4 grados de libertad es mayor que 0.05. Esto confirma que no hay suficiente evidencia para rechazar la hipótesis nula.
Conclusión
Con base en el valor-p y la comparación con el valor crítico, no se rechaza la hipótesis nula. Esto significa que no hay evidencia suficiente para afirmar que la preferencia por una marca depende de la región geográfica.
\[ \]
El problema plantea verificar si la opinión sobre la fusión de la corporación es independiente del número de acciones que posee el accionista. Para ello, utilizaremos la prueba de independencia de chi-cuadrado.
Plantear el contraste de hipótesis
Tabla de contingencia observada
La tabla observada es:
\[ \begin{array}{|c|c|c|c|c|} \hline \text{Número de acciones} & \text{A favor} & \text{En contra} & \text{Indecisos} & \text{Total} \\ \hline \text{Menos de 200} & 38 & 29 & 9 & 76 \\ \text{Entre 200 y 1000} & 30 & 42 & 7 & 79 \\ \text{Más de 1000} & 32 & 59 & 4 & 95 \\ \hline \text{Total} & 100 & 130 & 20 & 250 \\ \hline \end{array} \]
Calcular las frecuencias esperadas
Las frecuencias esperadas se calculan usando la fórmula:
\[ E_{ij} = \frac{(\text{Total fila}_i) \times (\text{Total columna}_j)}{\text{Total general}} \]
Por ejemplo, para la celda correspondiente a “Menos de 200” y “A favor”:
\[ E_{(Menos \, de \, 200, A \, favor)} = \frac{76 \times 100}{250} = 30.4 \]
La tabla de frecuencias esperadas completa es:
\[ \begin{array}{|c|c|c|c|} \hline \text{Número de acciones} & \text{A favor} & \text{En contra} & \text{Indecisos} \\ \hline \text{Menos de 200} & 30.4 & 39.52 & 6.08 \\ \text{Entre 200 y 1000} & 31.6 & 41.08 & 6.32 \\ \text{Más de 1000} & 38 & 49.4 & 7.6 \\ \hline \end{array} \]
Estadístico de prueba \(\chi^2\)
La fórmula para calcular el estadístico \(\chi^2\) en cada celda de la tabla de contingencia es:
\[ \chi^2_{ij} = \frac{(O_{ij} - E_{ij})^2}{E_{ij}} \]
donde: - \(O_{ij}\) es la frecuencia observada en la celda \(ij\), - \(E_{ij}\) es la frecuencia esperada en la celda \(ij\).
Paso a paso para cada celda:
Celda “Menos de 200” y “A favor”:
\[ \chi^2 = \frac{(38 - 30.4)^2}{30.4} = \frac{7.6^2}{30.4} = \frac{57.76}{30.4} \approx 1.9 \]
Celda “Menos de 200” y “En contra”:
\[ \chi^2 = \frac{(29 - 39.52)^2}{39.52} = \frac{(-10.52)^2}{39.52} = \frac{110.27}{39.52} \approx 2.8 \]
Celda “Menos de 200” y “Indeciso”:
\[ \chi^2 = \frac{(9 - 6.08)^2}{6.08} = \frac{2.92^2}{6.08} = \frac{8.53}{6.08} \approx 1.4 \]
Celda “Entre 200 y 1000” y “A favor”:
\[ \chi^2 = \frac{(30 - 31.6)^2}{31.6} = \frac{(-1.6)^2}{31.6} = \frac{2.56}{31.6} \approx 0.1 \]
Celda “Entre 200 y 1000” y “En contra”:
\[ \chi^2 = \frac{(42 - 41.08)^2}{41.08} = \frac{0.92^2}{41.08} = \frac{0.85}{41.08} \approx 0.0 \]
Celda “Entre 200 y 1000” y “Indeciso”:
\[ \chi^2 = \frac{(7 - 6.32)^2}{6.32} = \frac{0.68^2}{6.32} = \frac{0.46}{6.32} \approx 0.1 \]
Celda “Más de 1000” y “A favor”:
\[ \chi^2 = \frac{(32 - 38)^2}{38} = \frac{(-6)^2}{38} = \frac{36}{38} \approx 0.9 \]
Celda “Más de 1000” y “En contra”:
\[ \chi^2 = \frac{(59 - 49.4)^2}{49.4} = \frac{9.6^2}{49.4} = \frac{92.16}{49.4} \approx 1.9 \]
Celda “Más de 1000” y “Indeciso”:
\[ \chi^2 = \frac{(4 - 7.6)^2}{7.6} = \frac{(-3.6)^2}{7.6} = \frac{12.96}{7.6} \approx 1.7 \]
Suma de los valores \(\chi^2\)
Al sumar todos los términos obtenidos, el estadístico total \(\chi^2\) es:
\[ \chi^2 = 1.9 + 2.8 + 1.4 + 0.1 + 0.0 + 0.1 + 0.9 + 1.9 + 1.7 = 10.8 \]
Tabla con los términos \(\chi^2\)
\(\begin{array}{|c|c|c|c|} \hline \textbf{Número de acciones} & \textbf{A favor} & \textbf{En contra} & \textbf{Indeciso} \\ \hline \text{Menos de 200} & 1.9 & 2.8 & 1.4 \\ \hline \text{Entre 200 y 1000} & 0.1 & 0.0 & 0.1 \\ \hline \text{Más de 1000} & 0.9 & 1.9 & 1.7 \\ \hline \textbf{Total} & & & \textbf{10.8} \\ \hline \end{array}\)
Conclusión
Con el estadístico \(\chi^2 \approx 10.8\) y los grados de libertad \(gl = 4\), y dado que este valor es mayor que el valor crítico \(\chi^2_{0.10, 4} \approx 7.779\), rechazamos la hipótesis nula. Esto indica que la opinión sobre la fusión depende del número de acciones que posee el accionista.
\[ \]
Datos proporcionados:
Tamaño de la muestra: \(n = 81\)
Media muestral: \(\overline{x} = 0.9\)
Desviación estándar muestral: \(s = 0.66158\)
Hipótesis a contrastar:
\(H_0: \mu = 1\)
\(H_A: \mu \neq 1\) (contraste bilateral)
El valor-p se calcula a partir del estadístico de prueba de la forma: \[ Z = \frac{\bar{X} - \mu_0}{s / \sqrt{n}} = \frac{0.9 - 1}{0.66158 / \sqrt{81}} = \frac{-0.1}{0.07351} = -1.36 \]
El valor-p asociado se obtiene a partir de la tabla Z: \[ p = 2 \cdot P(Z \geq 1.36) = 2 \cdot 0.08665 = 0.1733 \] Este valor es mayor que los niveles de significación convencionales (por ejemplo, 0.05 o 0.01), por lo que no se rechaza la hipótesis nula.
\[ \]
2. Región de rechazo para un nivel de significación del 1%:
Para un nivel de significación \(\alpha = 0.01\), buscamos el valor crítico \(z_{\alpha/2}\) tal que: \[ P(Z \geq z_{\alpha/2}) = 0.005 \]
De las tablas Z, \(z_{\alpha/2} \approx 2.576\), por lo que la región de rechazo es: \[ RR = \left\{ \bar{X} : |\bar{X} - 1| \geq 2.576 \cdot \frac{0.66158}{\sqrt{81}} \right\} = \left\{ \bar{X} : |\bar{X} - 1| \geq 0.18936 \right\} \]
\[ \]
3. Cálculo del error tipo II:
Para el error tipo II, calculamos la probabilidad de no rechazar \(H_0\) cuando \(\mu = 0.9\) y cuando \(\mu = 1.1\):
Para \(\mu = 0.9\): \[ P \left( |\bar{X} - 1| \leq 0.18936 \mid \mu = 0.9 \right) = P \left( \left| Z \right| \leq \frac{0.18936}{0.07351} \right) = P \left( |Z| \leq 2.576 \right) \] Este valor es \(0.8879\), por lo que la probabilidad de error tipo II es 0.8879.
Para \(\mu = 1.1\), el cálculo es el mismo: \[ P \left( |\bar{X} - 1| \leq 0.18936 \mid \mu = 1.1 \right) = 0.8879 \]
\[ \]
4. Función de potencia:
La potencia es la probabilidad de rechazar \(H_0\) cuando \(H_A\) es verdadera. Por lo tanto: \[ \text{Potencia}(\mu) = P(\text{Rechazar } H_0 \mid \mu) \]
Para \(\mu = 0.9\): \[ \text{Potencia}(0.9) = 1 - 0.8879 = 0.1121 \]
Para \(\mu = 1.1\): \[ \text{Potencia}(1.1) = 1 - 0.8879 = 0.1121 \]
mu=seq(0.5,1.5,0.01)
potencia=1-(pnorm((1+0.18936-mu)*9/0.66158)-pnorm((1-0.18936-mu)*9/0.66158))
plot(mu,potencia,main = "Func de potencia del contraste", type="l")
\[ \]
1. Planteamiento del contraste de hipótesis y cuadro de decisión
Hipótesis:
Hipótesis nula \(H_0: \sigma \geq 0.5\) (el desvío estándar es mayor o igual a 0.5%)
Hipótesis alternativa \(H_1: \sigma < 0.5\) (el desvío estándar es menor al 0.5%)
En términos de la varianza (\(\sigma^2\)), esto se puede expresar como:
\(H_0: \sigma^2 \geq 0.25\)
\(H_1: \sigma^2 < 0.25\)
Cuadro de realidad (filas) y decisión (columnas):
\[ \begin{array}{|c|c|c|} \hline & \text{No vende } (\sigma < 0.5) & \text{Vende } (\sigma \geq 0.5) \\ \hline \sigma \geq 0.5 & \text{Error I} & \text{Correcto} \\ \hline \sigma < 0.5 & \text{Correcto} & \text{Error II} \\ \hline \end{array} \]
\[ \]
2. Región de rechazo El contraste de hipótesis para la varianza se hace con el estadístico de prueba \(\chi^2\), dado por: \[ \chi^2 = \frac{(n - 1) s^2}{\sigma_0^2} \] donde \(n = 81\), \(s^2 = 0.4377\), y \(\sigma_0^2 = 0.25\).
Para un nivel de significación del 10%, la región de rechazo está dada por: \[ RR = \left\{ \bar{x}: s^2 \leq 0.2009 \right\} \]
\[ \]
3. Decisión de vender o no el activo
En la muestra obtenemos \(s^2 = 0.4377\), que no pertenece a la región de rechazo \(s^2 \leq 0.2009\), por lo que no se rechaza la hipótesis nula.
Conclusión: No se rechaza \(H_0\), lo que significa que no hay evidencia suficiente para decir que la desviación estándar es menor a 0.5%. Por lo tanto, se recomienda vender el activo financiero debido a que es probable que el riesgo (desviación estándar) sea igual o mayor al 0.5%, lo que coincide con la aversión al riesgo de la persona.
\[ \]
Este ejercicio requiere que verifiquemos si los datos observados siguen una distribución exponencial con parámetro \(\lambda = 1\), utilizando una prueba de bondad de ajuste, como la prueba de chi-cuadrado.
Hipótesis del contraste
Tabla de frecuencias observadas y esperadas
\(\begin{array}{|c|c|c|} \hline \textbf{Intervalo} & \textbf{Frec Observada} & \textbf{Frec Esperada} \\ \hline [0, 0.25) & 17 & 17.91 \\ \hline [0.25, 0.50) & 14 & 13.96 \\ \hline [0.50, 0.75) & 13 & 10.86 \\ \hline [0.75, 1.50) & 20 & 20.19 \\ \hline [1.50, \infty) & 17 & 18.07 \\ \hline \end{array}\)
Cálculo de las frecuencias esperadas
Para una distribución exponencial \(Exp(1)\), la función de distribución acumulada (FDC) es:
\[ F(x) = 1 - e^{-x} \]
Usamos la FDC para calcular la probabilidad de que una observación caiga en cada uno de los intervalos definidos. Estas probabilidades multiplicadas por el tamaño de la muestra nos darán las frecuencias esperadas.
Intervalo \([0, 0.25)\):
\[ P(0 \leq X < 0.25) = F(0.25) - F(0) = \left(1 - e^{-0.25}\right) - \left(1 - e^{0}\right) = 1 - e^{-0.25} \]
Usando \(e^{-0.25} \approx 0.7788\):
\[ P(0 \leq X < 0.25) \approx 1 - 0.7788 = 0.2212 \]
Frecuencia esperada:
\[ E = 0.2212 \times 81 = 17.91 \]
Intervalo \([0.25, 0.50)\):
\[ P(0.25 \leq X < 0.50) = F(0.50) - F(0.25) = \left(1 - e^{-0.50}\right) - \left(1 - e^{-0.25}\right) \]
Usando \(e^{-0.50} \approx 0.6065\):
\[ P(0.25 \leq X < 0.50) = 1 - 0.6065 - (1 - 0.7788) = 0.7788 - 0.6065 = 0.1723 \]
Frecuencia esperada:
\[ E = 0.1723 \times 81 = 13.96 \]
Intervalo \([0.50, 0.75)\):
\[ P(0.50 \leq X < 0.75) = F(0.75) - F(0.50) \]
Con \(e^{-0.75} \approx 0.4724\):
\[ P(0.50 \leq X < 0.75) = 1 - 0.4724 - (1 - 0.6065) = 0.6065 - 0.4724 = 0.1341 \]
Frecuencia esperada:
\[ E = 0.1341 \times 81 = 10.86 \]
Intervalo \([0.75, 1.50)\):
\[ P(0.75 \leq X < 1.50) = F(1.50) - F(0.75) \]
Con \(e^{-1.50} \approx 0.2231\):
\[ P(0.75 \leq X < 1.50) = 1 - 0.2231 - (1 - 0.4724) = 0.4724 - 0.2231 = 0.2493 \]
Frecuencia esperada:
\[ E = 0.2493 \times 81 = 20.19 \]
Intervalo \([1.50, \infty)\):
\[ P(X \geq 1.50) = 1 - F(1.50) = e^{-1.50} \approx 0.2231 \]
Frecuencia esperada:
\[ E = 0.2231 \times 81 = 18.07 \]
Cálculo del estadístico \(\chi^2\)
El estadístico de prueba \(\chi^2\) se calcula como:
\[ \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} \]
Calculamos los términos para cada intervalo:
\[ \frac{(17 - 17.91)^2}{17.91} \approx \frac{(-0.91)^2}{17.91} = \frac{0.8281}{17.91} \approx 0.0462 \]
\[ \frac{(14 - 13.96)^2}{13.96} \approx \frac{(0.04)^2}{13.96} = \frac{0.0016}{13.96} \approx 0.0001 \]
\[ \frac{(13 - 10.86)^2}{10.86} \approx \frac{(2.14)^2}{10.86} = \frac{4.5796}{10.86} \approx 0.4216 \]
\[ \frac{(20 - 20.19)^2}{20.19} \approx \frac{(-0.19)^2}{20.19} = \frac{0.0361}{20.19} \approx 0.0018 \]
\[ \frac{(17 - 18.07)^2}{18.07} \approx \frac{(-1.07)^2}{18.07} = \frac{1.1449}{18.07} \approx 0.0634 \]
Sumamos todos los términos:
\[ \chi^2 \approx 0.0462 + 0.0001 + 0.4216 + 0.0018 + 0.0634 = 0.5331 \]
Grados de libertad
El número de grados de libertad para la prueba de chi-cuadrado es:
\[ gl = \text{Número de intervalos} - 1 - \text{Parámetros estimados} = 5 - 1 - 1 = 3 \]
Valor crítico y decisión
Para un nivel de significancia \(\alpha = 0.05\) y 3 grados de libertad, el valor crítico de chi-cuadrado es aproximadamente:
\[ \chi^2_{0.05, 3} = 7.815 \]
Como el valor calculado \(\chi^2 = 0.5331\) es mucho menor que el valor crítico de 7.815, no rechazamos la hipótesis nula.
Conclusión
Con un valor de \(\chi^2\) de 0.5331, que es menor que el valor crítico, no hay suficiente evidencia para rechazar la hipótesis nula. Por lo tanto, la evidencia muestral es consistente con la hipótesis de que \(X\) sigue una distribución exponencial con parámetro \(\lambda = 1\).
\[ \]
Datos proporcionados:
Retorno mensual promedio esperado: \(\mu = 1000\) USD.
Desviación estándar: \(\sigma = 50\) USD.
Tamaño de la muestra: \(n = 101\).
1. Contraste de hipótesis sobre el retorno mensual promedio
La empresa afirma que el retorno mensual promedio es de \(1000\) USD. Vamos a realizar un contraste de hipótesis para verificar si los datos proporcionados respaldan esta afirmación.
Planteo del contraste de hipótesis:
Este es un contraste bilateral.
Estadístico de prueba:
Dado que la muestra es lo suficientemente grande, utilizamos un estadístico \(z\), asumiendo que el retorno mensual sigue una distribución normal. El estadístico se calcula como:
\[ z = \frac{\overline{x} - \mu_0}{\sigma / \sqrt{n}} \]
Donde: - \(\mu_0 = 1000\) es el valor bajo la hipótesis nula, - \(\sigma = 50\), - \(n = 101\).
Ahora calculamos la media muestral usando los datos proporcionados en la tabla:
Media muestral:
Usamos los puntos medios de cada intervalo para estimar la media muestral:
\[ \overline{x} = \frac{26 \times 925 + 25 \times 975 + 33 \times 1025 + 17 \times 1075}{101} = \frac{100525}{101} \approx 995.30 \]
Cálculo del estadístico \(z\):
\[ z = \frac{995.30 - 1000}{50 / \sqrt{101}} = \frac{-4.7}{4.975} \approx -0.945 \]
Valor-p:
El valor-p para un contraste bilateral con \(z = -0.945\) es aproximadamente \(2 \times P(z > 0.945)\). Usando tablas de la distribución normal, encontramos que:
\[ P(z > 0.945) \approx 0.172 \]
Por lo tanto, el valor-p es:
\[ 2 \times 0.172 = 0.344 \]
Conclusión:
Dado que el valor-p \(0.344\) es mayor que el nivel de significancia \(\alpha = 0.05\), no rechazamos la hipótesis nula. No hay suficiente evidencia para concluir que el retorno mensual promedio es diferente de 1000 USD.
\[ \]
2. Evaluación de la decisión de la persona aversa al riesgo
Hipótesis nula \(H_0: \sigma \geq 50\) (la variabilidad es igual o mayor a lo anunciado).
Hipótesis alternativa \(H_1: \sigma < 50\) (la variabilidad es menor, lo que haría más atractiva la inversión).
En términos de la varianza, esto sería:
El cuadro de realidad (filas) y decisión (columnas) sería:
\(\begin{array}{|c|c|c|} \hline & \text{Invierte } (\sigma < 50) & \text{No invierte } (\sigma \geq 50) \\ \hline \sigma \geq 50 & \text{Error I} & \text{Correcto} \\ \hline \sigma < 50 & \text{Correcto} & \text{Error II} \\ \hline \end{array}\)
\(R R=\left\{\vec{x}: s^2 \leq 1948,23675\right\}\)
La función de potencia se utiliza para calcular la probabilidad de rechazar \(H_0\) cuando es falsa. La región de rechazo se define por \(s^2 \leq 1948.23675\), que es la varianza crítica en este caso. Si la varianza muestral es menor a este valor, se rechaza la hipótesis nula.
\[ \text { Potencia }\left(\sigma^2\right)=P\left(S^2 \leq 1948,2367 \mid \sigma^2\right)=P\left(\chi_{100}^2 \leq \frac{100 \times 1948,2367}{\sigma^2}\right) \]
var=seq(1000,3000,1)
potencia=pchisq(100*1948.2367/var,100)
plot(var,potencia,main = "Func de potencia del contraste", type="l")
c) Decisión sobre la inversión
La varianza muestral calculada es \(s^2 = 3519.94\), lo cual no pertenece a la región de rechazo \(s^2 \leq 1948.23675\). Por lo tanto, no se rechaza la hipótesis nula y se recomienda no invertir, ya que la varianza de los retornos mensuales parece ser mayor a lo anunciado por la empresa, lo cual podría implicar un mayor riesgo para la persona aversa al riesgo.
\[ \]
Frecuencias observadas:
\(\begin{array}{|c|c|c|c|c|} \hline \textbf{Gasto (en pesos)} & \textbf{Juguetería} & \textbf{Vestimenta} & \textbf{Cosmética} & \textbf{Total} \\ \hline 500 - 1.500 & 41 & 32 & 27 & 100 \\ \hline 1.500 - 3.000 & 49 & 51 & 25 & 125 \\ \hline 3.000 - 5.000 & 54 & 63 & 23 & 140 \\ \hline 5.000 - 10.000 & 66 & 54 & 15 & 135 \\ \hline \textbf{Total} & \textbf{210} & \textbf{200} & \textbf{90} & \textbf{500} \\ \hline \end{array}\)
Hipótesis
Frecuencias esperadas (basadas en las afirmaciones del vendedor):
\(\begin{array}{|c|c|c|c|c|} \hline \textbf{Gasto (en pesos)} & \textbf{Juguetería} & \textbf{Vestimenta} & \textbf{Cosmética} & \textbf{Total} \\ \hline 500 - 1.500 & 42 & 40 & 18 & 100 \\ \hline 1.500 - 3.000 & 52.5 & 50 & 22.5 & 125 \\ \hline 3.000 - 5.000 & 58.8 & 56 & 25.2 & 140 \\ \hline 5.000 - 10.000 & 56.7 & 54 & 24.3 & 135 \\ \hline \textbf{Total} & \textbf{210} & \textbf{200} & \textbf{90} & \textbf{500} \\ \hline \end{array}\)
Tabla de frecuencias observadas y esperadas: \(\begin{array}{|c|c|c|c|c|} \hline \textbf{Gasto (en pesos)} & \textbf{Juguetería} & \textbf{Vestimenta} & \textbf{Cosmética} & \textbf{Total} \\ \hline 500 - 1.500 & O = 41, E = 42 & O = 32, E = 40 & O = 27, E = 18 & 100 \\ \hline 1.500 - 3.000 & O = 49, E = 52.5 & O = 51, E = 50 & O = 25, E = 22.5 & 125 \\ \hline 3.000 - 5.000 & O = 54, E = 58.8 & O = 63, E = 56 & O = 23, E = 25.2 & 140 \\ \hline 5.000 - 10.000 & O = 66, E = 56.7 & O = 54, E = 54 & O = 15, E = 24.3 & 135 \\ \hline \end{array}\)
Cálculo del estadístico \(\chi^2\)
El estadístico \(\chi^2\) se calcula usando la fórmula:
\[ \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} \]
donde: - \(O_i\) son las frecuencias observadas, - \(E_i\) son las frecuencias esperadas.
Vamos a calcularlo para cada intervalo y categoría de regalo.
Términos \(\chi^2\):
\(\begin{array}{|c|c|c|c|c|} \hline \textbf{Gasto (en pesos)} & \textbf{Juguetería } \chi^2 & \textbf{Vestimenta } \chi^2 & \textbf{Cosmética } \chi^2 & \textbf{Total } \chi^2 \\ \hline 500 - 1.500 & 0.02 & 1.60 & 4.50 & 6.12 \\ \hline 1.500 - 3.000 & 0.23 & 0.02 & 0.28 & 0.53 \\ \hline 3.000 - 5.000 & 0.23 & 0.02 & 0.28 & 0.53 \\ \hline 5.000 - 10.000 & 1.53 & 0.00 & 3.56 & 5.09 \\ \hline \textbf{Total} & \textbf{2.01} & \textbf{1.64} & \textbf{8.62} & \textbf{12.27} \\ \hline \end{array}\)
Intervalo \(500 - 1.500\):
Intervalo \(1.500 - 3.000\):
Intervalo \(3.000 - 5.000\):
Intervalo \(5.000 - 10.000\):
Sumamos todos los términos:
\[ \chi^2 = 0.02 + 1.60 + 4.50 + 0.23 + 0.02 + 0.28 + 0.23 + 0.02 + 0.28 + 1.53 + 0.00 + 3.56 = 12.27 \]
Grados de libertad
El número de grados de libertad para esta prueba es:
\[ gl = (\text{Número de filas} - 1) \times (\text{Número de columnas} - 1) = (4 - 1) \times (3 - 1) = 3 \times 2 = 6 \]
Valor crítico y valor-p
Para un nivel de significancia \(\alpha = 0.05\) y 6 grados de libertad, el valor crítico de chi-cuadrado es aproximadamente:
\[ \chi^2_{0.05, 6} = 12.592 \]
Dado que \(\chi^2 = 12.27\) es menor que el valor crítico de 12.592, no rechazamos la hipótesis nula.
El valor-p correspondiente a \(\chi^2 = 12.27\) y 6 grados de libertad es aproximadamente 0.056.
Conclusión:
Dado que \(\chi^2 = 12.27\) y el valor-p es aproximadamente 0.056, no hay suficiente evidencia para rechazar la hipótesis nula al nivel de significancia del 5%. Por lo tanto, las proporciones observadas en las categorías de regalo son consistentes con las proporciones afirmadas por el vendedor.
\[ \]
El ejercicio plantea la necesidad de verificar la afirmación de que el 40% de las familias compran juguetes, el 40% compran vestimenta, y el 20% compran cosméticos. Para verificar esta afirmación, utilizaremos una prueba de bondad de ajuste de chi-cuadrado, donde comparamos las frecuencias observadas en la tabla con las frecuencias esperadas basadas en las proporciones afirmadas por el vendedor.
Datos proporcionados
\(\begin{array}{|c|c|} \hline \textbf{Categoría de Regalo Navideño} & \textbf{Frecuencia Observada} \\ \hline \textbf{Juguetería} & 210 \\ \hline \textbf{Vestimenta} & 200 \\ \hline \textbf{Cosmética} & 90 \\ \hline \textbf{Total} & 500 \\ \hline \end{array}\)
Hipótesis
Con la información proporcionada en la tabla, el objetivo es verificar si esta afirmación es cierta. Se solicita realizar un contraste de bondad de ajuste para verificar si las proporciones observadas en la muestra coinciden con las proporciones afirmadas por el vendedor, utilizando un nivel de significancia del 5%.
Tabla de términos para el cálculo de \(\chi^2\)
\[ \begin{array}{|c|c|c|c|c|} \hline \textbf{Categoría} & \textbf{Frec Observ } O_i & \textbf{Prop Esperada } p_i & \textbf{Frec Esperada } E_i & \frac{(O_i - E_i)^2}{E_i} \\ \hline \textbf{Juguetería} & 210 & 0.40 & 200 & 0.50 \\ \hline \textbf{Vestimenta} & 200 & 0.40 & 200 & 0.00 \\ \hline \textbf{Cosmética} & 90 & 0.20 & 100 & 1.00 \\ \hline \textbf{Total} & 500 & 1.00 & 500 & \textbf{1.50} \\ \hline \end{array} \]
Cálculo del estadístico \(\chi^2\)
El estadístico \(\chi^2\) se calcula usando la fórmula:
\[ \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} \]
donde: - \(O_i\) son las frecuencias observadas, - \(E_i\) son las frecuencias esperadas.
Calculamos para cada categoría:
\[ \frac{(210 - 200)^2}{200} = \frac{10^2}{200} = \frac{100}{200} = 0.5 \]
\[ \frac{(200 - 200)^2}{200} = \frac{0^2}{200} = 0 \]
\[ \frac{(90 - 100)^2}{100} = \frac{(-10)^2}{100} = \frac{100}{100} = 1 \]
El estadístico \(\chi^2\) es la suma de estos valores:
\[ \chi^2 = 0.5 + 0 + 1 = 1.5 \]
Grados de libertad
El número de grados de libertad para esta prueba es:
\[ gl = \text{Número de categorías} - 1 = 3 - 1 = 2 \]
Valor crítico y valor-p
Para un nivel de significancia \(\alpha = 0.05\) y 2 grados de libertad, el valor crítico de \(\chi^2\) es aproximadamente:
\[ \chi^2_{0.05, 2} = 5.991 \]
Dado que \(\chi^2 = 1.5\) es menor que el valor crítico de 5.991, no rechazamos la hipótesis nula.
Valor-p
El valor-p correspondiente a \(\chi^2 = 1.5\) y 2 grados de libertad es aproximadamente \(0.472\). Este valor-p es mucho mayor que \(\alpha = 0.05\), lo que refuerza nuestra decisión de no rechazar la hipótesis nula.
Conclusión
Con un valor de \(\chi^2 = 1.5\) y un valor-p de \(0.472\), no hay suficiente evidencia para rechazar la afirmación del vendedor. Esto significa que las proporciones observadas en los datos son consistentes con la afirmación del vendedor sobre las proporciones de familias que compran juguetes, vestimenta y cosméticos.
\[ \]
1. Cálculo de la estimación puntual de la proporción de familias que gastan entre 5 y 10 mil pesos en regalos navideños
La estimación puntual de la proporción se calcula dividiendo el número de familias que gastan entre 5 y 10 mil pesos entre el total de familias encuestadas.
Del cuadro, observamos que:
Número de familias que gastan entre 5 y 10 mil pesos: \(66 + 54 + 15 = 135\)
Número total de familias: Suma de todas las celdas de la tabla:
\[ 41 + 32 + 27 + 49 + 51 + 25 + 54 + 63 + 23 + 66 + 54 + 15 = 500 \]
Por lo tanto, la proporción puntual \(\hat{p}\) de familias que gastan entre 5 y 10 mil pesos es:
\[ \hat{p} = \frac{135}{500} = 0.27 \]
\[ \]
2. Estimación de la proporción con un intervalo de confianza del 95%
Para calcular el intervalo de confianza del 95%, usamos la fórmula para el intervalo de confianza para una proporción:
\[ IC = \hat{p} \pm Z_{\alpha/2} \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}} \]
Donde: - \(\hat{p} = 0.27\) es la proporción estimada, - \(Z_{\alpha/2}\) es el valor crítico para un nivel de confianza del 95%, que es aproximadamente 1.96, - \(n = 500\) es el tamaño de la muestra.
Primero calculamos el error estándar:
\[ \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}} = \sqrt{\frac{0.27(1 - 0.27)}{500}} = \sqrt{\frac{0.27 \times 0.73}{500}} = \sqrt{\frac{0.1971}{500}} \approx 0.01985 \]
Ahora calculamos el intervalo de confianza:
\[ IC = 0.27 \pm 1.96 \times 0.01985 \]
\[ IC = 0.27 \pm 0.03892 \]
Por lo tanto, el intervalo de confianza del 95% para la proporción es:
\[ IC = (0.2311, 0.3089) \]
Esto significa que estamos 95% seguros de que la verdadera proporción de familias que gastan entre 5 y 10 mil pesos en regalos navideños está entre 23.11% y 30.89%.
\[ \]
3. Cálculo del tamaño muestral necesario para un error de 2 puntos porcentuales
Sabemos que la proporción estimada es aproximadamente 0.30, y queremos que el error de estimación sea de 2 puntos porcentuales (\(E = 0.02\)) con un nivel de confianza del 95%. La fórmula para calcular el tamaño muestral \(n\) es:
\[ n = \frac{Z_{\alpha/2}^2 \cdot \hat{p}(1 - \hat{p})}{E^2} \]
Sustituyendo los valores:
\[ n = \frac{(1.96)^2 \cdot 0.3(1 - 0.3)}{(0.02)^2} = \frac{3.8416 \cdot 0.3 \cdot 0.7}{0.0004} = \frac{3.8416 \cdot 0.21}{0.0004} = \frac{0.806736}{0.0004} = 2016.84 \]
Por lo tanto, el tamaño muestral necesario es aproximadamente 2017 familias para garantizar que el error de estimación sea de como máximo 2 puntos porcentuales con un nivel de confianza del 95%.
Conclusión