ACTIVIDAD # 3: LAS MATRICES Y SUS APLICACIONES EN ESTADÍSTICA

ESTADÍSTICA COMPUTACIONAL - UNINORTE

Profesor:Elmer Rodríguez Stevez

Fecha de Entrega: 08 de Febrero de 2020

Taller 3

Jonathan Martínez - Efraín Martelo

1. Crear un vector aleatorio de distribución Poisson de longitud \(30\) y media \(10\).

##  [1] 10  9 15  5 13  7  8 16 14 10  4  8  3 11 15 22  6 13 12  9 11 15 15 14  5
## [26]  8  6  9 11  7

2. Del resultado anterior, seleccionar dos muestras aleatorias de tamaño \(8\),con la condición que primera se tome con reemplazo y la segunda sin reemplazo.

## [1] 13 22  9 12 15  3 10  9
## [1]  9  8 15  6 13 22  9 11

3. Del resultado de la primera muestra, crear dos matrices bajo las siguientes condiciones: que en la primera matriz, los elementos se muestren en dirección columna y que en la segunda matriz, los elementos se muestren en dirección fila. Además, muestre que al menos uno de los objetos que ha creado efectivamente es una matriz y finalmente veifique su dimensión.

##      [,1] [,2] [,3] [,4]
## [1,]   13    9   15   10
## [2,]   22   12    3    9
## [1] "matrix"
##      [,1] [,2] [,3] [,4]
## [1,]   13   22    9   12
## [2,]   15    3   10    9
## [1] 2 4

4. Suponga que ha realizado un experimento o un estudio en su campo laboral, el cual tiene cuatro variables de interés (A,B,C y D) y cuatro réplicas por variable (R1,R2,R3 y R4). Asuma que los datos recogidos lo obtuvo de la segunda matriz generada del punto 2). Etiquete esta matriz tanto en fila como en columna.

##     A  B  C  D
## R1  9  7 12 11
## R2 10 10  6  6
## R3 14 11  8  9
## R4 22 14 10  9

5. Copie nuevamente la matriz obtenida en 2). Asuma que ésta es una tabla de contingencia. Agregue un vector suma tanto en fila como en columna.

##     A  B  C  D
## R1  9  7 12 11
## R2 10 10  6  6
## R3 14 11  8  9
## R4 22 14 10  9
##     A  B  C  D
## R1  9  7 12 11
## R2 10 10  6  6
## R3 14 11  8  9
## R4 22 14 10  9
##    55 42 36 35
##     A  B  C  D    
## R1  9  7 12 11  39
## R2 10 10  6  6  32
## R3 14 11  8  9  42
## R4 22 14 10  9  55
##    55 42 36 35 168
##     A  B  C  D    
## R1  9  7 12 11  39
## R2 10 10  6  6  32
## R3 14 11  8  9  42
## R4 22 14 10  9  55
##    55 42 36 35 168

6. Dada las siguientes matrices

\(A=\begin{bmatrix} 1 & 0 & 9\\ 3 & 5 & 2\\ 8 & 2 & 1 \end{bmatrix}\) ,

\(B=\begin{bmatrix} 3 & 1 & 5\\ 0 & 2 & 1\\ 7 & 2 & 4 \end{bmatrix}\)

Calcular:

  1. \(A+B\)
##      [,1] [,2] [,3]
## [1,]    4    1   14
## [2,]    3    7    3
## [3,]   15    4    5
  1. \(B\times A\)
##      [,1] [,2] [,3]
## [1,]   46   15   34
## [2,]   14   12    5
## [3,]   45   18   71
  1. \(det(B)\)
## [1] -45
  1. \(A^{T}\)
##      [,1] [,2] [,3]
## [1,]    1    3    8
## [2,]    0    5    2
## [3,]    9    2    1
  1. Verifique la siguiente igualdad: \(A*A^{-1} = I\)
##        [,1]   [,2]   [,3]
## [1,] -0.003 -0.059  0.148
## [2,] -0.043  0.233 -0.082
## [3,]  0.111  0.007 -0.016
##      [,1] [,2] [,3]
## [1,]    1    0    0
## [2,]    0    1    0
## [3,]    0    0    1
##      [,1] [,2] [,3]
## [1,]    1    0    0
## [2,]    0    1    0
## [3,]    0    0    1
##      [,1] [,2] [,3]
## [1,] TRUE TRUE TRUE
## [2,] TRUE TRUE TRUE
## [3,] TRUE TRUE TRUE
  1. Calcule la traza de la matriz \(A\)
## [1] 7

7. [Problema de aplicación Análisis Multivariante: Inferencia sobre el vector de medias, con la matriz de varianzas y covarianzas conocida]

En la tabla de abajo se registra la estatura \(X_{1}\) (en pulgadas) y el peso \(X_{2}\) (en libras) para una muestra de \(20\) estudiantes de educación media. Se asume que esta muestra es generada en una población normal bivariada \(N_{2} (\boldsymbol{\mu,\sigma})\), donde

\(\hspace{11cm} {\color{Blue} \sum =\begin{pmatrix} 20 & 100\\ 100 & 1000 \end{pmatrix}}\)

Por lo que usted debe verificar la hipótesis que la estatura media es \(70\) y el peso medio es \(170\); es decir, \(H_{0}:\boldsymbol{\mu}=(20,170){}'\) en este tipo de personas, a un nivel de significancia del \(5\)%.

Ayuda: El vector de medias debe darles \(\bar{x_{1}}=71.45\) y \(\bar{x_{2}}=164.7\). Además, el estadístico de prueba debe darles \(\chi_{o}^{2}=8.4026\)

Desarrollo

Creamos los vectores

Convertimos en dataframe los vectores

##    X1  X2
## 1  69 153
## 2  74 175
## 3  68 155
## 4  70 135
## 5  72 172
## 6  67 150
## 7  66 115
## 8  70 137
## 9  76 200
## 10 68 130
## 11 72 140
## 12 79 265
## 13 74 185
## 14 67 112
## 15 66 140
## 16 71 150
## 17 74 165
## 18 75 185
## 19 75 210
## 20 76 220
##    X1  X2
## 1  69 153
## 2  74 175
## 3  68 155
## 4  70 135
## 5  72 172
## 6  67 150
## 7  66 115
## 8  70 137
## 9  76 200
## 10 68 130
## 11 72 140
## 12 79 265
## 13 74 185
## 14 67 112
## 15 66 140
## 16 71 150
## 17 74 165
## 18 75 185
## 19 75 210
## 20 76 220
## [1] 2
## [1] 20
##     X1     X2 
##  71.45 164.70
##        X1   X2
## [1,] 1.45 -5.3
##      [,1] [,2]
## [1,]   20  100
## [2,]  100 1000
##       [,1]   [,2]
## [1,]  0.10 -0.010
## [2,] -0.01  0.002
##     [,1]
## X1  1.45
## X2 -5.30
##        [,1]
## [1,] 8.4026
## [1] 5.991465
## [1] "Conclusión: Se rechaza la Ho a nivel de alpha"

El objetivo del ejercicio 8 es demostrar que pueden montar el texto de abajo en Rmarkdown. Tenga en cuenta el código LaTeX para la parte matemática:

Punto 8:

[problema de aplicación. Análsisis Multivariante. inferencia sobre el vector de medias, con la matriz de convarianzas iguales y desconocidas]

Cuatro pruebas psicológicas fueron aplicadas sobre 32 hombres y 32 mujeres. Las variables a considerar son:

\(X_{1}:\) Inconsistencias pictóricas                           \(X_{3}:\) Forma de emplear el papel
\(X_{2}:\) Reconocimiento de herramientas            \(X_{4}:\) Vocabulario

Se asumirá que cada grupo de personas es una muestra aleatoria de una población tetra-variante, con distribución normal de media \({\mu _{i}}\left ( i=1,2 \right )\) y la matriz covarianza \(\sum\) , igual y desconocida para las dos poblaciones. El experimento se llevó a cabo de tal forma que las poblaciones (hombres y mujeres) resultaran independientes. El interés se dirige a contrastar la hipótesis; “mujeres y hombres tienen respuestas, en promedio, igual con respecto a cada uno de los 4 atributos considerados”. Use un nivel de significancia del 5% (Rencher 2002, págs. 124-125).

Los datos “prueba.psico” se encuentran adjuntos dentro de la carperta Actividades del Drive .

Connotación: En la gran mayoría de kas situaciones practicas es poco frecuente conocer la matriz de covarianzas. Y cuando al investigador le interese desarrollar un contraste de hipótesis para el vector de medias \(\mu\) de una población normal p variante con matriz de varianzas y covarianzas desconocidas, se emplea en el campo multivariado de la estadístca \(T ^{2}\) de Hotelling (Hotelling (1931)). La cual es equivalente a la distribución de t-Student con \(\left ( n-1 \right )\) grados de libertad, al momento de contrastar una hipótesis de una población univariada.

La matriz de convarianzas, se estima mediante las matrices de covarianzas muestrales; así,

\[S_{p}=\frac{(n_{1}-1)S_{1}+(n_{2}-1)S_{2}}{n_{1}+n_{2}-2}\]

La estadística

\[T^{2}= \frac{n_{1} n_{2}}{n_{1}+n_{2}}{(\bar{X_{1}}-\bar{X_{2}})}'S_{p}^{-1}(\bar{X_{1}}-\bar{X_{2}})\]

Se distribuye como \(T^{2}\) con dimensiones p (p variables) y \(v=(n_{1}+n_{2}-2)\) grados de libertad. La región crítitca para contrastar la hipotesís \({H_{0}}= \mu _{1}= \mu _{2}\) es

\[T^{2}> \frac{\boldsymbol{v_{p}}}{(\boldsymbol{v-p+1})}\mathit{F_{(\boldsymbol{p,v-p+1})}}(\alpha)\] Con un nivel de significancia \(\alpha\). Así, una muestra que cumpla la desigualdad anterior, provoca el rechazo de la hipotesís \({H_{0}}= \mu _{1}= \mu _{2}\)

Fin.

Por:

  • Jonathan Martínez
  • Efrín Martelo