EJERCICIO 1

Un clavadista olimpico es evaluado con diez clavado de practica con las siguientes calificaciones 1.7, 5.3, 7.6, 8.9, 9.0, 9.1, 9.3, 9.6, 9.9, 9.9. Probar la hipotesis de que la funcion de distribucion de las calificaciones esta dada por F(x). Donde:

\[f(x) = \begin{cases} 0 & x < 0 \\ \frac{x^2}{100} & 0\leq x\leq 10 \\ 1 & 10 < x \end{cases}\]

Chunk e1

Prueba a utilizar

## [1] "Prueba de Kolmogorov de dos colas"

Hipotesis

## [1] "Ho: F(x) = F*(x) para toda x en el dominio (La funcion de distribucion desconocida es en realidad una conocida y especificada)."     
## [2] "vs"                                                                                                                                  
## [3] "Ha: F(x) != F(x) para al menos un valor de x (La funcion de distribucion desconocida no es en realidad una conocida y especificada)."

Estadistica

## [1] "T=sup|F*(x)-S(x)|=" "0.3921"

Procedimiento completo del calculo del valor de la estadistica

## [1] "Viene en el codigo del chunk anterior (Chunck e1)"

Regla de decision con el valor de los respectivos cuantiles

## [1] "Se rechaza H0 si w(cuantil)<T(estadistica), donde w(1-alpha)="
## [2] "0.409"                                                        
## [3] ", con alpha=0.05 y T="                                        
## [4] "0.3921"

Conclusion

## [1] "Como w="                                                                                                                                                                                                              
## [2] "0.409"                                                                                                                                                                                                                
## [3] "y T="                                                                                                                                                                                                                 
## [4] "0.3921"                                                                                                                                                                                                               
## [5] "No se rechaza H0"                                                                                                                                                                                                     
## [6] "Por lo que se concluye que:"                                                                                                                                                                                          
## [7] "No hay informacion suficiente para rechazar la hipotesis de que la funcion de distribucion de las calificaciones esta dada por la funcion F(x) anteriormente definida (conocida y especificada), con un alpha del 5%."

Ejercicio 2:

Cinco ni~nos de cuarto grado de primaria fueron seleccionados al azar de todos los niños de ese grado en la escuela “15 de septiembre”, para participar en una carrera. Sus tiempos en segundos fueron: 6.3, 4.2, 4.7, 6.0 y 5.7. Probar con la hipótesis de que los tiempos provienen de una distribución uniforme en el intervalo de 4 a 8 segundos.

1. Prueba a utilizar:

Prueba Anderson-Darling.

2. Hipotesis:

\[H_0: La\ muestra\ proviene\ de\ una\ distribución\ Uniforme(4,8)\]

\[H_1: La\ muestra\ no\ se\ distribuye\ Uniforme(4,8)\]

3. Estadística de Prueba:

\[ A^z_n = -n - \sum_{i=1}^{n} ( \frac {2i-1}{n}) [ln(F^*(x_i))-ln(1-F^*(x_{n-i+1})]\]

donde \(F^*(x)\) es la distribución que se quiere probar.

4. Procedimiento:

Tenemos en nuestra muestra los siguientes datos:

\[6.3, 4.2, 4.7, 6.0, 5.7\] Primero ordenamos los valores de menor a mayor

## [1] 4.2 4.7 5.7 6.0 6.3

Ahora le aplicamos la distribución propuesta a probar, es decir, tenemos que la muestra se distribuye Uniforme (4,8) continua, en otras palabras:

\[\begin{equation} \label{eq:aqui-le-mostramos-como-hacerle-la-llave-grande} F^*(x) = \left\{ \begin{array}{ll} 0 & \mathrm{si\ } x < 4 \\ \frac{x-4}{4} & \mathrm{si\ } 4 \le x < 8 \\ 1 & \mathrm{si\ } x \ge 8 \end{array} \right. \end{equation}\]

Entonces:

## [1] 0.050 0.175 0.425 0.500 0.575

Ahora sacaremos \(l_1\) y \(l_2\) donde:

\[l_1= ln(F^*(x))\\ y\\ l_2= ln(1-F^*(x))\]

## [1] -2.9957323 -1.7429693 -0.8556661 -0.6931472 -0.5533852
## [1] 3.995732 2.742969 1.855666 1.693147 1.553385

Ahora calcularemos cada valor de la suma anterior y guardarlo en un vector para despues aplicar la suma:

## [1] 5
## [1] -1.44234704 -0.04982212  1.00000000  2.04982212  3.44234704
## [1] -0.28846941 -0.02989327  1.00000000  2.86975097  6.19622466
## [1] 9.747613

Ya por último sacamos el estádistico:

## [1] -14.74761

Por lo tanto:

\[A^z_n= -14.74761\]

5.Regla de decisión

Dado que si tomamos a \(\alpha = 5%\) y que estamos bajo una distribución de parámetros conocidos y \(n \ge 5\) entonces:

\[A_{1- \alpha} = A_{0.95} = 2.492\]

Yo Rechazo \(H_0\) si:

\[A^z_n > A_{1-\alpha}\]

Entonces:

\[ A^z_n=-14.7476 \ngtr 2.492= A_{0.95}\]

\(\therefore No\ se \ rechaza\ H_0\)

6. Conclusión:

No existe información suficiente para rechazar que la muestra de los tiempos de los niños se distribuye \(Uniforme(4,8)\)

EJERCICIO 3

Se desea probar la hipotesis de que las tasas de interes de un determinado producto financiero tiene el comportamiento de una variable aleatoria como funcion de distribucion normal.

9.1, 5, 7.3, 7.4, 5.5,

8.6, 7, 4.3, 4.7, 8,

4, 8.5, 6.4, 6.1, 5.8,

9.5, 5.2, 6.7, 8.3, 9.2.

Chunk e3

Prueba a utilizar

## [1] "Prueba de Lilliefors para normalidad"

Hipotesis

## [1] "Ho: La muestra se distribuye N(media,varianza) (Los datos provienen de una distribucion normal)."       
## [2] "vs"                                                                                                     
## [3] "Ha: La muestra no se distribuye N(media,varianza) (Los datos no  provienen de una distribucion normal)."

Estadistica

## [1] "T=sup|F*(x)-S(x)|=" "0.0798427470600117"

Procedimiento completo del calculo del valor de la estadistica

## [1] "Viene en el codigo del chunk anterior (Chunk e3)"

Regla de decision con el valor de los respectivos cuantiles

## [1] "Se rechaza H0 si w(cuantil)<T(estadistica), donde w(1-alpha)="
## [2] "0.192"                                                        
## [3] ", con alpha=0.05 y T="                                        
## [4] "0.0798427470600117"

Conclusion

## [1] "Como w="                                                                                                                                                                                                                               
## [2] "0.192"                                                                                                                                                                                                                                 
## [3] "y T="                                                                                                                                                                                                                                  
## [4] "0.0798427470600117"                                                                                                                                                                                                                    
## [5] "No se rechaza H0"                                                                                                                                                                                                                      
## [6] "Por lo que se concluye que:"                                                                                                                                                                                                           
## [7] "No hay informacion suficiente para rechazar la hipotesis de que las tasas de interes de un determinado producto financiero tiene el comportamiento de una variable aleatoria como funcion de distribucion normal, con un alpha del 5%."

EJERCICIO 4

Se obtuvieron sesenta y dos observaciones de un experimento, y se plantea la pregunta de si dichas observaciones provienen de una distribución normal con media 12 y desviación estándar 3. Ninguna observación se encontró por debajo del cuartil inferior de la distribución, 35 estuvieron por arriba de cuartil superior, 22 tomaron valores menores a la mediana, y 5 estuvieron entre la mediana y el cuartil superior. ¿Es posible concluir que las observaciones provienen de la distribución mencionada? Usaré un a prueba x2 porque 1. se sospecha de una distribución 2. la distribucion F0 tiene parametros conocidos 3. se puede poner en categorias, yo no conozo los datos como tal" H0 los datos siguen una distribució N(12,3) H1 los datos no siguen una distribució N(12,3) “procedemos a acomodar los datos en categorias obs un cartil es el 25% de los datos que corresponde a 13 datos” .25*52

‘asi hallamos p1 i.e. la probabilidad de estar em la primeracategoria dado h0’

el cual se distribuye x2 con un grado de libertad tomando una alpha de .05

qteorica<-dchisq(.95,1,ncp=0) qteorica

##   [,1]   [,2]    [,3]         [,4]   
## x "<25%" "<=50%" "50%<d<=75%" "d>75%"
## d "0"    "22"    "5"          "35"
## [1] "colpsando los datos"
##   [,1]         [,2]   
## s "25%<d<=50%" "50%<d"
## u "22"         "39"
## [1] 0.25
## [1] "para hallar p2 i.e la prob de estar en la segunda cat tomanos el complemento"
## [1] 0.5
## [1] "obtenemos los valores esperados ej j en 1,2"
## [1] "de ello obtenemos"
## [1] 5.5
## [1] 19.5
## [1] "obtenemos es estadisticos Q"
## [1] 69

procedemos a comparar el cuantil y Q

## [1] 3.841459

como Q> cuartil teorico Se rechaza H0 es decir las observaciones no provienen de una distribución normal con media 12 y desviación estándar 3

EJERCICIO 5

Un cierto banco otorga credito a las personas con una tasa preferencial, de tal manera que los acreditados pueden pagar en cualquier momento desde que piden el pr??estamo hasta 8 semanas posteriores para que les sea respetada la tasa preferencial. Se seleccionaron aleatoriamente a 1,000 personas y observaron su comportamiento, generando de esta manera la siguiente tabla de frecuencia:

Semana Créditos Pagados
Menos de 1 semana 64
1 x < 2 195
2 x < 3 287
3 x < 4 241
4 x < 5 140
5 x < 6 51
6 x < 7 25
7 x < 8 4
Mayores a 8 semanas 1
:——————— ———————:

¿Usted piensa que el pago de estos créditos sigue una distribución binomial de \(n=10\) y \(p=0.25\)? Realice la prueba \(\chi^2\) para verificar que la suposición es válida con un \(99 \%\) de confianza.

1. Prueba a utiliza:

\(Prueba\ de\ la\ \chi^2\)

2. Hípotesis:

\[ H_0: Los\ pagos\ de\ los\ créditos\ tienen\ una\ distribución\ Binomial\ (10,0.25)\]

\[ H_1: Los\ pagos\ de\ los\ créditos\ no\ se\ distribuyen\ Binomial\ (10,0.25)\]

3. Estadistico de Prueba:

\[Q= \sum_{j=1}^k \frac{(f_j - e_j)^2}{e_j} \sim \chi^2_{(k-1)}\]

4. Procedimiento:

Como para los casos de de entre semana sietes a ocho, y para semanas mayores o iguales a 8 semanas tenemos muestas \(\le 5\) entonces colapsamos ambas categorías y combinamos a la de entre 6 y siete semanas y la convertimos en 6 semanas o más. Es decir:

Semana Créditos Pagados
Menos de una semana 64
\(1 \le x < 2\) 195
\(2 \le x < 3\) 287
\(3 \le x < 4\) 241
\(4 \le x < 5\) 140
\(5 \le x < 6\) 51
Mayor igual a 6 semanas 30
:———————- ———————:

Entonces creamos nuestra muestra correpondiente:

## [1] 6
## [1]  64 195 287 241 140  51

Ahora le aplicamos la función correspondiente con a la cual queremmos probar, es decir, para esta muestra tenemos la siguiente distribución a probar:

\[f(x)= \binom{10}{x} (0.25)^x (0.75)^{10-x}\]

Aplicamos esa distribución a la muestra:

## [1] 0.18771172 0.28156757 0.25028229 0.14599800 0.05839920 0.01972771

Ya que calculamos los valores de \(P_j\), Pasaremos a calcular \(e_j\) que se calcula de la siguiente manera:

\[e_j = n*P_j\] con \(n\) el numero de valores en la muestra.

## [1] 187.71172 281.56757 250.28229 145.99800  58.39920  19.72771

Ahora pasamos al cálculo de la \(Q\):

## [1] 6
## [1] 15304.5886  7493.9448  1348.1904  9025.3798  6658.6905   977.9563
## [1]  81.532410  26.615085   5.386679  61.818516 114.020234  49.572731
## [1] 338.9457

Entonces:

\[Q=338.9457\]

5. Regla de desición:

Dado que queremos un nivel de confianza del \(99\%\) tenemos una \(\alpha = 1\%\) entonces tenmos que se \(Rechaza\ H_0\) si:

\[Q> \chi^{2,99\%}_{7}\]

## [1] 18.47531

Entonces:

\[\chi^{2,99\%}_{7}=18.47531\] \[Q=338.9457 > \chi^{2,99\%}_{7}= 18.47531\]

\(\therefore Se\ rechaza\ H_0\)

6. Conclusión:

Los pagos de los créditos no se distribuyen \(Binomial\ (10,0.25)\) con un nivel de convfianza del \(99\%\)

EJERCICIO 6

El gerente de una tienda quiere probar la hip ??otesis de que los clientes llegan aleatoriamente a su tienda,para ello registro el tiempo transcurrido entre las llegadas sucesivas de clientes en una ma~nana. El tiempoen minutos es el siguiente:

\[3.6, 6.2, 12.9, 14.2, 38.0, 3.8, 10.8, 6.1, 10.1, 22.1, 4.2, 4.6, 1.4, 3.3, 8.2\]

Pruebe la hípotesis nula de que el tiempo entre las llegadas de los clientes se distribuyen con función de distribución exponencial.

1. Prueba a utilizar:

\(Prueba\ de\ Lilliefors\ para\ exponencial\)

2. Hípotesis:

\[H_0: El\ tiempo\ de\ llegada\ de\ los\ clientes\ proviene\ de\ una\ distribución\ exponencial.\] \[H_1: El\ tiempo\ de\ llegada\ de\ los\ clientes\ no\ es\ de\ una\ distribución\ exponencial.\]

3. Estadístico de prueba:

\[T_2 = sup_x{|F^*(x)-S(x)|}\]

4. Procedimiento:

Primero calciulesmos los valores para nuestra muestra de la siguiente manera:

\[Z_i = \frac {x_i}{\overline{x}}\]

Entonces:

## [1] 9.966667
##  [1] 0.3612040 0.6220736 1.2943144 1.4247492 3.8127090 0.3812709 1.0836120
##  [8] 0.6120401 1.0133779 2.2173913 0.4214047 0.4615385 0.1404682 0.3311037
## [15] 0.8227425
##  [1] 0.1404682 0.3311037 0.3612040 0.3812709 0.4214047 0.4615385 0.6120401
##  [8] 0.6220736 0.8227425 1.0133779 1.0836120 1.2943144 1.4247492 2.2173913
## [15] 3.8127090

Ya con nuestros datos ordenados procederemos a aplicar \(S(x)\), es decir, la función de distribución empírica:

## Empirical CDF 
## Call: ecdf(z)
##  x[1:15] = 0.14047, 0.3311, 0.3612,  ..., 2.2174, 3.8127
##  [1] 0.06666667 0.13333333 0.20000000 0.26666667 0.33333333 0.40000000
##  [7] 0.46666667 0.53333333 0.60000000 0.66666667 0.73333333 0.80000000
## [13] 0.86666667 0.93333333 1.00000000

Sacamos las proabilidades de la función de distribución de la exponencial dada por:

\[F^*(x) = \begin{cases} 1-e^{- \frac{ \lambda}{x}} & \mathrm{si\ } x > 0\\ 0 & \mathrm{si\ } x < 0\\ \end{cases}\]

con =1

Entonces:

##  [1] 0.1310487 0.2818693 0.3031632 0.3170072 0.3438755 0.3696868 0.4577565
##  [8] 0.4631699 0.5607746 0.6370092 0.6616289 0.7259143 0.7594312 0.8911072
## [15] 0.9779117

Calculamos el valor de la \(T_2\) para cada valor de la muestra:

##  [1] 0.064382060 0.148535957 0.103163180 0.050340494 0.010542141
##  [6] 0.030313187 0.008910157 0.070163457 0.039225437 0.029657417
## [11] 0.071704439 0.074085718 0.107235466 0.042226140 0.022088260

AHora sacamos el \(sup_x |F^*(X)-S(x)|\)

## [1] 0.148536

Por lo tanto:

\[T_2 = 0.148536\]

5. Regla de decisión

Utilizando un nivel de significacia \(\alpha=5\%\) calculamos el cuantil de la tabla correspondiente de la prueba, es decir, \(W_{1-\alpha}= W_{0.95}\). Entonces:

\[W_{0.95}\ se\ encuentra\ entre\ el\ intervalo\ [0.2774,0.2606]\]

Entonce \(Rechazamos\ H_0\) si:

\[T_2> W_{0.95}\] Entonces:

\[T_2= 0.148536\ es\ menor\ a\ [0.2774,0.2606]\]

\(\therefore No\ se\ rechaza\ H_0\)

6.Cónclusión

No existe información suficiente para rechazar que la llegada de los cliente se distribuye \(Exponencial\)

EJERCICIO 7

Paso 1. Prueba a utilizar.

Prueba de bondad de ajuste Ji-Cuadrada \(\alpha = 0.05\).

Paso 2. Hipótesis.

H\(_0\): Los datos siguen una distribución uniforme \(P_j=1/4\), \(j=1,...,4\).

vs

H\(_a\): Los datos no siguen una distribución uniforme.

Paso 3. Estadística de prueba

Para obtener el estadístico necesitamos:

\(e_j=n*P_j\)

\(Q = \sum_{j=1}^{k}\frac{(f_j-e_j)^2}{e_j}\)

Paso 4. Cálculo completo del valor de la estadística

\(e_j=n*P_j=41*(1/4)= 10.25\), \(j=1,...,4\).

\(Q = \sum_{j=1}^{4}\frac{(f_j-e_j)^2}{e_j}\) = \(\frac{(11-10.25)^2}{10.25} + \frac{(15-10.25)^2}{10.25} + \frac{(8-10.25)^2}{10.25} + \frac{(6-10.25)^2}{10.25}\) = \(4.6\)

## [1] 4.6

Paso 5. Regla de decisión

Como \(\alpha=0.05\) y el número de categorías es 4, entonces calculamos el cuantil \(1-\alpha = 0.95\) de una Ji-Cuadrada con (4-1) grados de libertad.

Entonces la regla de decisión queda:

Rechazamos H\(_0\) si \(Q>q\) con \(q = \chi^2_{(3)}(0.95)\)

## [1] 7.814728

Paso 6. Conclusión

Como \(Q = 4.6\) y \(q = 7.814728\) entonces \(Q\ngtr q\)

\(\implies\) No se rechaza H\(_0\).

Entonces, tenemos pruebas estadísticas suficientes para decir que los datos siguen una distribución uniforme \(P_j=1/4\), \(j=1,...,4\).

El resultado sugiere que los alumnos fueron audaces, ya que seguramente se pusieron de acuerdo para decidir que neumático sería el desinflado en su historia ficticia.

EJERCICIO 8

Se ajustan los impactos de las bombas de la Segunda Guerra Mundial a unadistribución de Poisson? En el análisis de los impactos por bombas V-1 en la Segunda Guerra Mundial, el sur de Londres se subdividió en regiones, cada una con una área de \(.25 km^2\). En total, 535 bombas impactaron el área combinada de 577 regiones. Utilice los valores que se listan aquí y pruebe la aseveración de que las frecuencias reales se ajustan a una distribución Poisson. Utilice un nivel de significancia de 0.05. Especifique:

  1. ¿Por qué se aplica la distribución Poisson?

  2. Calcula el número medio de impactos por región

  3. Utilice los valores que se listan aquí y pruebe la aseveración de que las frecuencias reales se ajustan a una distribución Poisson. Utilice un nivel de significancia del 0.05.

SOLUCIÓN

  1. Se aplica la distribución poisson porque la poisson es una distribución de probabilidad discreta en los enteros que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que ocurra un determinado número de eventos durante cierto período de tiempo. En este caso bombas en ciera area.
  2. Calculamos la media muestral que corresponde a:

\[\overline{x}=\sum_{i=1}^{557} x_{i}/557\] en este caso \(\sum_{i=1}^{557} x_{i}\)=535, es decir el número de bombas

e

## [1] 0.9605027

observación:es el estimador máximo verosimil para lamda

Ho: Los datos siguen una distribución poisson de parámetro emv.

vs

Ha: Los datos no siguen una distribución poisson de parámetro emv.

Calculamos nuestra estadística Q=\(\sum_{j=1}^{5} (f_{j}-e_{j})^2/e_{j}\) , donde Q se distribuye \(\chi2\) con 3 grados de libertad.

PROCEDIMIENTO

Calcularemos las \(p_{j}\), \(j \in {1,2,3,4}\)

## [1] 1367.14
## [1] 7.814728

como v>x, es decir es estadistico es mayor que la \(q_{teorica}\) rechazamos H0 Es decir los datos no siguen una distribución Poisson.

EJERCICIO 9

En R fije la semilla 2019, y genere 25 observaciones distribuidas como una N(0, 1) y con ella realice:

  1. Calcule y grafique la función de distribución empírica de las observaciones generadas.

  2. Agrega sobre esa misma gráfica, la curva de la distribución verdadera N(0,1). A partir de las gráficas anteriores ¿La función de distribución empírica es similar a la distribución teórica de los datos?.

  3. Realice al menos dos pruebas de bondad de ajuste para probar que la muestra proviene de una distribución N(0,1).

Sol

La gráfica roja es la distribución de la normal estandar mientras la negra es nuestra distribución empírica, notamos una similitud entre ambas

## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  u
## D = 0.14657, p-value = 0.1797
## 
##  Anderson-Darling normality test
## 
## data:  u
## A = 0.40582, p-value = 0.3263
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  u
## D = 0.11251, p-value = 0.875
## alternative hypothesis: two-sided

EJERCICIO 10

Paso 1. Prueba a utilizar.

Prueba de bondad de ajuste Anderson-Darling \(\alpha=0.10\)

Paso 2. Hipótesis.

\(H_0\): La muestra tiene una distribución normal con media y varianza desconocidas.

vs

\(H_a\): La muestra no tiene una distribución normal.

Paso 3. Estadística de prueba

\(A^2_{n}=-n-Q\)

donde

\(Q = \sum^n_{i=1}(\frac{2i-1}{n})[ln(F^*(X))+ln(1-F^*(X)(X_{n-i+1}))]\)

Paso 5. Regla de decisión

Como \(\alpha=0.10\), obtenemos el cuantil \(A_{.90}\) de la tabla de valores críticos de la Tabla Anderson-Darling para el caso de Normalidad.

Entonces, la regla de decisión queda:

Se rechaza H\(_0\) si \(A^2_{n}>A_{.90}\)

Paso 6. Conclusión

Como la estadística de prueba ajustada es \(A^2_{n} = 7.892384\) y \(A_{.90} = 0.632\) entonces \(A^2_{n} > A_{.90}\)

\(\implies\) Se rechaza H\(_0\).

Entonces, tenemos pruebas estadísticas suficientes para decir que la muestra no tiene una distribución normal.