Taller 3
Jonathan Martínez - Efraín Martelo
1. Crear un vector aleatorio de distribución Poisson de longitud \(30\) y media \(10\).
## [1] 10 9 15 5 13 7 8 16 14 10 4 8 3 11 15 22 6 13 12 9 11 15 15 14 5
## [26] 8 6 9 11 7
2. Del resultado anterior, seleccionar dos muestras aleatorias de tamaño \(8\),con la condición que primera se tome con reemplazo y la segunda sin reemplazo.
## [1] 13 22 9 12 15 3 10 9
## [1] 9 8 15 6 13 22 9 11
3. Del resultado de la primera muestra, crear dos matrices bajo las siguientes condiciones: que en la primera matriz, los elementos se muestren en dirección columna y que en la segunda matriz, los elementos se muestren en dirección fila. Además, muestre que al menos uno de los objetos que ha creado efectivamente es una matriz y finalmente veifique su dimensión.
## [,1] [,2] [,3] [,4]
## [1,] 13 9 15 10
## [2,] 22 12 3 9
## [1] "matrix"
## [,1] [,2] [,3] [,4]
## [1,] 13 22 9 12
## [2,] 15 3 10 9
## [1] 2 4
4. Suponga que ha realizado un experimento o un estudio en su campo laboral, el cual tiene cuatro variables de interés (A,B,C y D) y cuatro réplicas por variable (R1,R2,R3 y R4). Asuma que los datos recogidos lo obtuvo de la segunda matriz generada del punto 2). Etiquete esta matriz tanto en fila como en columna.
## A B C D
## R1 9 7 12 11
## R2 10 10 6 6
## R3 14 11 8 9
## R4 22 14 10 9
5. Copie nuevamente la matriz obtenida en 2). Asuma que ésta es una tabla de contingencia. Agregue un vector suma tanto en fila como en columna.
## A B C D
## R1 9 7 12 11
## R2 10 10 6 6
## R3 14 11 8 9
## R4 22 14 10 9
## A B C D
## R1 9 7 12 11
## R2 10 10 6 6
## R3 14 11 8 9
## R4 22 14 10 9
## 55 42 36 35
## A B C D
## R1 9 7 12 11 39
## R2 10 10 6 6 32
## R3 14 11 8 9 42
## R4 22 14 10 9 55
## 55 42 36 35 168
## A B C D
## R1 9 7 12 11 39
## R2 10 10 6 6 32
## R3 14 11 8 9 42
## R4 22 14 10 9 55
## 55 42 36 35 168
6. Dada las siguientes matrices
\(A=\begin{bmatrix} 1 & 0 & 9\\ 3 & 5 & 2\\ 8 & 2 & 1 \end{bmatrix}\) ,
\(B=\begin{bmatrix} 3 & 1 & 5\\ 0 & 2 & 1\\ 7 & 2 & 4 \end{bmatrix}\)
Calcular:
- \(A+B\)
## [,1] [,2] [,3]
## [1,] 4 1 14
## [2,] 3 7 3
## [3,] 15 4 5
- \(B\times A\)
## [,1] [,2] [,3]
## [1,] 46 15 34
## [2,] 14 12 5
## [3,] 45 18 71
- \(det(B)\)
## [1] -45
- \(A^{T}\)
## [,1] [,2] [,3]
## [1,] 1 3 8
## [2,] 0 5 2
## [3,] 9 2 1
- Verifique la siguiente igualdad: \(A*A^{-1} = I\)
## [,1] [,2] [,3]
## [1,] -0.003 -0.059 0.148
## [2,] -0.043 0.233 -0.082
## [3,] 0.111 0.007 -0.016
## [,1] [,2] [,3]
## [1,] 1 0 0
## [2,] 0 1 0
## [3,] 0 0 1
## [,1] [,2] [,3]
## [1,] 1 0 0
## [2,] 0 1 0
## [3,] 0 0 1
## [,1] [,2] [,3]
## [1,] TRUE TRUE TRUE
## [2,] TRUE TRUE TRUE
## [3,] TRUE TRUE TRUE
- Calcule la traza de la matriz \(A\)
## [1] 7
7. [Problema de aplicación Análisis Multivariante: Inferencia sobre el vector de medias, con la matriz de varianzas y covarianzas conocida]
En la tabla de abajo se registra la estatura \(X_{1}\) (en pulgadas) y el peso \(X_{2}\) (en libras) para una muestra de \(20\) estudiantes de educación media. Se asume que esta muestra es generada en una población normal bivariada \(N_{2} (\boldsymbol{\mu,\sigma})\), donde
\(\hspace{11cm} {\color{Blue} \sum =\begin{pmatrix} 20 & 100\\ 100 & 1000 \end{pmatrix}}\)
Por lo que usted debe verificar la hipótesis que la estatura media es \(70\) y el peso medio es \(170\); es decir, \(H_{0}:\boldsymbol{\mu}=(20,170){}'\) en este tipo de personas, a un nivel de significancia del \(5\)%.
Ayuda: El vector de medias debe darles \(\bar{x_{1}}=71.45\) y \(\bar{x_{2}}=164.7\). Además, el estadístico de prueba debe darles \(\chi_{o}^{2}=8.4026\)
Desarrollo
Creamos los vectores
x <- c (69, 74, 68, 70, 72, 67, 66, 70, 76, 68, 72, 79, 74, 67, 66, 71, 74, 75, 75, 76)
y <- c(153, 175, 155, 135, 172, 150, 115, 137, 200, 130, 140, 265, 185, 112, 140, 150, 165, 185, 210, 220)Convertimos en dataframe los vectores
## X1 X2
## 1 69 153
## 2 74 175
## 3 68 155
## 4 70 135
## 5 72 172
## 6 67 150
## 7 66 115
## 8 70 137
## 9 76 200
## 10 68 130
## 11 72 140
## 12 79 265
## 13 74 185
## 14 67 112
## 15 66 140
## 16 71 150
## 17 74 165
## 18 75 185
## 19 75 210
## 20 76 220
## X1 X2
## 1 69 153
## 2 74 175
## 3 68 155
## 4 70 135
## 5 72 172
## 6 67 150
## 7 66 115
## 8 70 137
## 9 76 200
## 10 68 130
## 11 72 140
## 12 79 265
## 13 74 185
## 14 67 112
## 15 66 140
## 16 71 150
## 17 74 165
## 18 75 185
## 19 75 210
## 20 76 220
## [1] 2
## [1] 20
## X1 X2
## 71.45 164.70
## X1 X2
## [1,] 1.45 -5.3
## [,1] [,2]
## [1,] 20 100
## [2,] 100 1000
## [,1] [,2]
## [1,] 0.10 -0.010
## [2,] -0.01 0.002
## [,1]
## X1 1.45
## X2 -5.30
## [,1]
## [1,] 8.4026
## [1] 5.991465
##Concluimos
if (chi.calc > chi.tabla) {
print("Conclusión: Se rechaza la Ho a nivel de alpha")
} else {
print("Conclusión: Se acepta la Ho a nivel de alpha")
}## [1] "Conclusión: Se rechaza la Ho a nivel de alpha"
El objetivo del ejercicio 8 es demostrar que pueden montar el texto de abajo en Rmarkdown. Tenga en cuenta el código LaTeX para la parte matemática:
Punto 8:
[problema de aplicación. Análsisis Multivariante. inferencia sobre el vector de medias, con la matriz de convarianzas iguales y desconocidas]
Cuatro pruebas psicológicas fueron aplicadas sobre 32 hombres y 32 mujeres. Las variables a considerar son:
\(X_{1}:\) Inconsistencias pictóricas \(X_{3}:\) Forma de emplear el papel
\(X_{2}:\) Reconocimiento de herramientas \(X_{4}:\) Vocabulario
Se asumirá que cada grupo de personas es una muestra aleatoria de una población tetra-variante, con distribución normal de media \({\mu _{i}}\left ( i=1,2 \right )\) y la matriz covarianza \(\sum\) , igual y desconocida para las dos poblaciones. El experimento se llevó a cabo de tal forma que las poblaciones (hombres y mujeres) resultaran independientes. El interés se dirige a contrastar la hipótesis; “mujeres y hombres tienen respuestas, en promedio, igual con respecto a cada uno de los 4 atributos considerados”. Use un nivel de significancia del 5% (Rencher 2002, págs. 124-125).
Los datos “prueba.psico” se encuentran adjuntos dentro de la carperta Actividades del Drive .
Connotación: En la gran mayoría de kas situaciones practicas es poco frecuente conocer la matriz de covarianzas. Y cuando al investigador le interese desarrollar un contraste de hipótesis para el vector de medias \(\mu\) de una población normal p variante con matriz de varianzas y covarianzas desconocidas, se emplea en el campo multivariado de la estadístca \(T ^{2}\) de Hotelling (Hotelling (1931)). La cual es equivalente a la distribución de t-Student con \(\left ( n-1 \right )\) grados de libertad, al momento de contrastar una hipótesis de una población univariada.
La matriz de convarianzas, se estima mediante las matrices de covarianzas muestrales; así,
\[S_{p}=\frac{(n_{1}-1)S_{1}+(n_{2}-1)S_{2}}{n_{1}+n_{2}-2}\]
La estadística
\[T^{2}= \frac{n_{1} n_{2}}{n_{1}+n_{2}}{(\bar{X_{1}}-\bar{X_{2}})}'S_{p}^{-1}(\bar{X_{1}}-\bar{X_{2}})\]
Se distribuye como \(T^{2}\) con dimensiones p (p variables) y \(v=(n_{1}+n_{2}-2)\) grados de libertad. La región crítitca para contrastar la hipotesís \({H_{0}}= \mu _{1}= \mu _{2}\) es
\[T^{2}> \frac{\boldsymbol{v_{p}}}{(\boldsymbol{v-p+1})}\mathit{F_{(\boldsymbol{p,v-p+1})}}(\alpha)\] Con un nivel de significancia \(\alpha\). Así, una muestra que cumpla la desigualdad anterior, provoca el rechazo de la hipotesís \({H_{0}}= \mu _{1}= \mu _{2}\)
Fin.Por:
- Jonathan Martínez
- Efrín Martelo