Funciones

El código y las funciones utilizadas para la simulación son las mismas que las empleadas para el escenario 1 y pueden encontrarse accediendo a: http://rpubs.com/JessicaP/892464

Generación de datos

4. Probabilidades lejos

\(p = \left(\frac{2}{3}, \frac{1}{6}, \frac{1}{15}, \frac{1}{10}\right) \approx (0.67, 0.17, 0.07, 0.1)\)

Simulación n=20

Se generan 1000 tablas \(4 \times 4\) con las mismas probabilidades y tamaƱo de muestra. Probabilidades \(p = \frac{2}{3}, \frac{1}{6}, \frac{1}{15}, \frac{1}{10}\) y tamaƱo de muestra \(n=20\)

El promedio y la varianza de los betas estimados para este caso serĆ­a:

Betas estimados
Promedio Varianza
\(\beta_0\) 0.7576863 0.0085181
\(\beta_1^{(1)}\) 0.0021922 0.0126886
\(\beta_1^{(2)}\) -0.0000836 0.0118253
\(\beta_0^{(,2)}\) -0.2335939 0.0396892
\(\beta_1^{(1,2)}\) 0.0058321 0.0505359
\(\beta_1^{(2,2)}\) 0.0082404 0.0493113

Distribución de los betas

Confirmamos si la distribución de todos los betas es normal realizando el test de Shapiro Wilk multivariado.

## 
##  Generalized Shapiro-Wilk test for Multivariate Normality by
##  Villasenor-Alva and Gonzalez-Estrada
## 
## data:  as.matrix(t(Betas_resu$Betas))
## MVW = 0.98852, p-value < 2.2e-16

Como el \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad multivariada entre los betas.

Analizamos la normalidad de cada beta de forma marginal (o individual)

Valor P Test Shapiro univariado normalidad
\(\beta_0\) \(\beta_1^{(1)}\) \(\beta_1^{(2)}\) \(\beta_0^{(,2)}\) \(\beta_1^{(1,2)}\) \(\beta_1^{(2,2)}\)
0 0 0 0.0084668 0.0558722 0.2563247

Como el \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad univariada en ninguno de los betas.

Analizando la sensibilidad y especificidad por subpoblación.

El promedio y la varianza de la sensibilidad y especificidad por subppoblación sería:

Sensibilidad y especificidad estimadas
Promedio Varianza
Sensibilidad subpoblación 1 0.7576863 0.0085181
Especificidad subpoblación 1 0.5240925 0.0347325
Sensibilidad subpoblación 2 0.7576028 0.0088850
Especificidad subpoblación 2 0.5322493 0.0304231
Sensibilidad subpoblación 3 0.7598785 0.0096858
Especificidad subpoblación 3 0.5321167 0.0350034
Sensibilidad subpoblación 4 0.7597949 0.0099049
Especificidad subpoblación 4 0.5402736 0.0334225

Analizando conjuntamente la sensibilidad y le especificidad por subpoblaciones:







Simulación n=50

Se generan 1000 tablas \(4 \times 4\) con las mismas probabilidades y tamaƱo de muestra.

El promedio y la varianza de los betas estimados para este caso serĆ­a:

Betas estimados
Promedio Varianza
\(\beta_0\) 0.7772041 0.0030631
\(\beta_1^{(1)}\) 0.0017404 0.0043253
\(\beta_1^{(2)}\) 0.0014675 0.0037689
\(\beta_0^{(,2)}\) -0.2202779 0.0211876
\(\beta_1^{(1,2)}\) 0.0003214 0.0276858
\(\beta_1^{(2,2)}\) 0.0034088 0.0291985

Distribución de los betas

Confirmamos si la distribución de todos los betas es normal realizando el test de Shapiro Wilk multivariado.

## 
##  Generalized Shapiro-Wilk test for Multivariate Normality by
##  Villasenor-Alva and Gonzalez-Estrada
## 
## data:  as.matrix(t(Betas_resu$Betas))
## MVW = 0.99798, p-value = 0.1518

Como el \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto hay normalidad multivariada entre los betas.

Analizamos la normalidad de cada beta de forma marginal (o individual)

Valor P Test Shapiro univariado normalidad
\(\beta_0\) \(\beta_1^{(1)}\) \(\beta_1^{(2)}\) \(\beta_0^{(,2)}\) \(\beta_1^{(1,2)}\) \(\beta_1^{(2,2)}\)
0.7953311 0.4661375 0.7217004 0.001066 0.6521154 0.0554892

Criterio: \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad univariada en beta. \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto sĆ­ hay normalidad univariada en beta.

Analizando la sensibilidad y especificidad por subpoblación.

El promedio y la varianza de la sensibilidad y especificidad por subppoblación sería:

Sensibilidad y especificidad estimadas
Promedio Varianza
Sensibilidad subpoblación 1 0.7772041 0.0030631
Especificidad subpoblación 1 0.5569262 0.0206120
Sensibilidad subpoblación 2 0.7786716 0.0032586
Especificidad subpoblación 2 0.5618025 0.0226062
Sensibilidad subpoblación 3 0.7789445 0.0032598
Especificidad subpoblación 3 0.5589880 0.0231586
Sensibilidad subpoblación 4 0.7804120 0.0033379
Especificidad subpoblación 4 0.5638643 0.0206099

Analizando conjuntamente la sensibilidad y le especificidad por subpoblaciones:







Simulación n=75

Se generan 1000 tablas \(4 \times 4\) con las mismas probabilidades y tamaƱo de muestra.

El promedio y la varianza de los betas estimados para este caso serĆ­a:

Betas estimados
Promedio Varianza
\(\beta_0\) 0.7816902 0.0020398
\(\beta_1^{(1)}\) 0.0005407 0.0028486
\(\beta_1^{(2)}\) 0.0021863 0.0025123
\(\beta_0^{(,2)}\) -0.2137744 0.0137195
\(\beta_1^{(1,2)}\) 0.0011244 0.0181951
\(\beta_1^{(2,2)}\) 0.0025835 0.0183655

Distribución de los betas

Confirmamos si la distribución de todos los betas es normal realizando el test de Shapiro Wilk multivariado.

## 
##  Generalized Shapiro-Wilk test for Multivariate Normality by
##  Villasenor-Alva and Gonzalez-Estrada
## 
## data:  as.matrix(t(Betas_resu$Betas))
## MVW = 0.99812, p-value = 0.2686

Como el \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto hay normalidad multivariada entre los betas.

Analizamos la normalidad de cada beta de forma marginal (o individual)

Valor P Test Shapiro univariado normalidad
\(\beta_0\) \(\beta_1^{(1)}\) \(\beta_1^{(2)}\) \(\beta_0^{(,2)}\) \(\beta_1^{(1,2)}\) \(\beta_1^{(2,2)}\)
0.8244776 0.2036229 0.3134623 0.002224 0.2622098 0.3153495

Criterio: \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad univariada en beta. \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto sĆ­ hay normalidad univariada en beta.

Analizando la sensibilidad y especificidad por subpoblación.

El promedio y la varianza de la sensibilidad y especificidad por subppoblación sería:

Sensibilidad y especificidad estimadas
Promedio Varianza
Sensibilidad subpoblación 1 0.7816902 0.0020398
Especificidad subpoblación 1 0.5679158 0.0135231
Sensibilidad subpoblación 2 0.7838765 0.0022183
Especificidad subpoblación 2 0.5726856 0.0152072
Sensibilidad subpoblación 3 0.7822309 0.0021351
Especificidad subpoblación 3 0.5695808 0.0144293
Sensibilidad subpoblación 4 0.7844172 0.0021490
Especificidad subpoblación 4 0.5743507 0.0132994

Analizando conjuntamente la sensibilidad y le especificidad por subpoblaciones:







Simulación n=100

Se generan 1000 tablas \(4 \times 4\) con las mismas probabilidades y tamaƱo de muestra.

El promedio y la varianza de los betas estimados para este caso serĆ­a:

Betas estimados
Promedio Varianza
\(\beta_0\) 0.7847791 0.0015286
\(\beta_1^{(1)}\) 0.0012151 0.0021531
\(\beta_1^{(2)}\) 0.0002842 0.0019137
\(\beta_0^{(,2)}\) -0.2112992 0.0110711
\(\beta_1^{(1,2)}\) -0.0000164 0.0143012
\(\beta_1^{(2,2)}\) 0.0020772 0.0143639

Distribución de los betas

Confirmamos si la distribución de todos los betas es normal realizando el test de Shapiro Wilk multivariado.

## 
##  Generalized Shapiro-Wilk test for Multivariate Normality by
##  Villasenor-Alva and Gonzalez-Estrada
## 
## data:  as.matrix(t(Betas_resu$Betas))
## MVW = 0.9979, p-value = 0.1065

Como el \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto hay normalidad multivariada entre los betas.

Analizamos la normalidad de cada beta de forma marginal (o individual)

Valor P Test Shapiro univariado normalidad
\(\beta_0\) \(\beta_1^{(1)}\) \(\beta_1^{(2)}\) \(\beta_0^{(,2)}\) \(\beta_1^{(1,2)}\) \(\beta_1^{(2,2)}\)
0.4195816 0.180832 0.4598508 0.0019369 0.0156793 0.1073951

Criterio: \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad univariada en beta. \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto sĆ­ hay normalidad univariada en beta.

Analizando la sensibilidad y especificidad por subpoblación.

El promedio y la varianza de la sensibilidad y especificidad por subppoblación sería:

Sensibilidad y especificidad estimadas
Promedio Varianza
Sensibilidad subpoblación 1 0.7847791 0.0015286
Especificidad subpoblación 1 0.5734799 0.0109686
Sensibilidad subpoblación 2 0.7850633 0.0017799
Especificidad subpoblación 2 0.5758413 0.0108500
Sensibilidad subpoblación 3 0.7859942 0.0015576
Especificidad subpoblación 3 0.5746786 0.0112331
Sensibilidad subpoblación 4 0.7862784 0.0016084
Especificidad subpoblación 4 0.5770400 0.0092747

Analizando conjuntamente la sensibilidad y le especificidad por subpoblaciones:







Simulación n=226

Se generan 1000 tablas \(4 \times 4\) con las mismas probabilidades y tamaƱo de muestra.

El promedio y la varianza de los betas estimados para este caso serĆ­a:

Betas estimados
Promedio Varianza
\(\beta_0\) 0.7925741 0.0006893
\(\beta_1^{(1)}\) 0.0004200 0.0008902
\(\beta_1^{(2)}\) -0.0013632 0.0008369
\(\beta_0^{(,2)}\) -0.2026120 0.0047424
\(\beta_1^{(1,2)}\) -0.0027125 0.0062989
\(\beta_1^{(2,2)}\) 0.0031342 0.0060921

Distribución de los betas

Confirmamos si la distribución de todos los betas es normal realizando el test de Shapiro Wilk multivariado.

## 
##  Generalized Shapiro-Wilk test for Multivariate Normality by
##  Villasenor-Alva and Gonzalez-Estrada
## 
## data:  as.matrix(t(Betas_resu$Betas))
## MVW = 0.99829, p-value = 0.4804

Como el \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto hay normalidad multivariada entre los betas.

Analizamos la normalidad de cada beta de forma marginal (o individual)

Valor P Test Shapiro univariado normalidad
\(\beta_0\) \(\beta_1^{(1)}\) \(\beta_1^{(2)}\) \(\beta_0^{(,2)}\) \(\beta_1^{(1,2)}\) \(\beta_1^{(2,2)}\)
0.0958977 0.398591 0.8627604 0.6378785 0.8611628 0.9847528

Criterio: \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad univariada en beta. \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto sĆ­ hay normalidad univariada en beta.

Analizando la sensibilidad y especificidad por subpoblación.

El promedio y la varianza de la sensibilidad y especificidad por subppoblación sería:

Sensibilidad y especificidad estimadas
Promedio Varianza
Sensibilidad subpoblación 1 0.7925741 0.0006893
Especificidad subpoblación 1 0.5899621 0.0043994
Sensibilidad subpoblación 2 0.7912109 0.0007228
Especificidad subpoblación 2 0.5917331 0.0044274
Sensibilidad subpoblación 3 0.7929941 0.0007144
Especificidad subpoblación 3 0.5876695 0.0042502
Sensibilidad subpoblación 4 0.7916309 0.0006587
Especificidad subpoblación 4 0.5894405 0.0045217

Analizando conjuntamente la sensibilidad y le especificidad por subpoblaciones:

Distancia Kullback-Leibler

Probabilidades escenario 2: \(p=(0.4,0.1,0.2,0.3)\)

Probabilidades escenario 4: \(p = \left(\frac{2}{3}, \frac{1}{6}, \frac{1}{15}, \frac{1}{10}\right) \approx (0.67, 0.17, 0.07, 0.1)\)

px <- c(0.4,0.1,0.2,0.3)
py <- c(2/3, 1/6, 1/15, 1/10)

sum(px*log2(px/py))
## [1] 0.4239985