Funciones

El código y las funciones utilizadas para la simulación son las mismas que las empleadas para el escenario 1 y pueden encontrarse accediendo a: http://rpubs.com/JessicaP/892464

Generación de datos

3. Probabilidades cerca

\(p = \left( \frac{7}{15}, \frac{7}{60}, \frac{1}{6}, \frac{1}{4}\right) \approx ( 0.47, 0.12, 0.17, 0.25)\)

Simulación n=20

Se generan 1000 tablas \(4 \times 4\) con las mismas probabilidades y tamaƱo de muestra. Probabilidades \(7/15, 7/60, 1/6, 1/4\) y tamaƱo de muestra \(n=20\)

El promedio y la varianza de los betas estimados para este caso serĆ­a:

Betas estimados
Promedio Varianza
\(\beta_0\) 0.7278065 0.0221546
\(\beta_1^{(1)}\) -0.0043834 0.0230328
\(\beta_1^{(2)}\) 0.0037111 0.0239243
\(\beta_0^{(,2)}\) -0.1743926 0.0364940
\(\beta_1^{(1,2)}\) 0.0077292 0.0407763
\(\beta_1^{(2,2)}\) 0.0026750 0.0425882

Distribución de los betas

Confirmamos si la distribución de todos los betas es normal realizando el test de Shapiro Wilk multivariado.

## 
##  Generalized Shapiro-Wilk test for Multivariate Normality by
##  Villasenor-Alva and Gonzalez-Estrada
## 
## data:  as.matrix(t(Betas_resu$Betas))
## MVW = 0.97601, p-value < 2.2e-16

Como el \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad multivariada entre los betas.

Analizamos la normalidad de cada beta de forma marginal (o individual)

Valor P Test Shapiro univariado normalidad
\(\beta_0\) \(\beta_1^{(1)}\) \(\beta_1^{(2)}\) \(\beta_0^{(,2)}\) \(\beta_1^{(1,2)}\) \(\beta_1^{(2,2)}\)
0 0 0 0 1.2e-06 0

Como el \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad univariada en ninguno de los betas.

Analizando la sensibilidad y especificidad por subpoblación.

El promedio y la varianza de la sensibilidad y especificidad por subppoblación sería:

Sensibilidad y especificidad estimadas
Promedio Varianza
Sensibilidad subpoblación 1 0.7278065 0.0221546
Especificidad subpoblación 1 0.5534140 0.0211994
Sensibilidad subpoblación 2 0.7315176 0.0150698
Especificidad subpoblación 2 0.5598001 0.0220937
Sensibilidad subpoblación 3 0.7234231 0.0211919
Especificidad subpoblación 3 0.5567597 0.0225780
Sensibilidad subpoblación 4 0.7271342 0.0199738
Especificidad subpoblación 4 0.5631458 0.0209752

Analizando conjuntamente la sensibilidad y le especificidad por subpoblaciones:







Simulación n=50

Se generan 1000 tablas \(4 \times 4\) con las mismas probabilidades y tamaƱo de muestra.

El promedio y la varianza de los betas estimados para este caso serĆ­a:

Betas estimados
Promedio Varianza
\(\beta_0\) 0.7589532 0.0059235
\(\beta_1^{(1)}\) -0.0006398 0.0077027
\(\beta_1^{(2)}\) 0.0020664 0.0068864
\(\beta_0^{(,2)}\) -0.1813746 0.0116835
\(\beta_1^{(1,2)}\) 0.0037748 0.0153520
\(\beta_1^{(2,2)}\) 0.0021212 0.0141872

Distribución de los betas

Confirmamos si la distribución de todos los betas es normal realizando el test de Shapiro Wilk multivariado.

## 
##  Generalized Shapiro-Wilk test for Multivariate Normality by
##  Villasenor-Alva and Gonzalez-Estrada
## 
## data:  as.matrix(t(Betas_resu$Betas))
## MVW = 0.99253, p-value < 2.2e-16

Como el \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad multivariada entre los betas.

Analizamos la normalidad de cada beta de forma marginal (o individual)

Valor P Test Shapiro univariado normalidad
\(\beta_0\) \(\beta_1^{(1)}\) \(\beta_1^{(2)}\) \(\beta_0^{(,2)}\) \(\beta_1^{(1,2)}\) \(\beta_1^{(2,2)}\)
0.0337861 0 0.484205 0.0032311 1.6e-06 0.534367

Criterio: \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad univariada en beta. \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto sĆ­ hay normalidad univariada en beta.

Analizando la sensibilidad y especificidad por subpoblación.

El promedio y la varianza de la sensibilidad y especificidad por subppoblación sería:

Sensibilidad y especificidad estimadas
Promedio Varianza
Sensibilidad subpoblación 1 0.7589532 0.0059235
Especificidad subpoblación 1 0.5775785 0.0076888
Sensibilidad subpoblación 2 0.7610195 0.0053523
Especificidad subpoblación 2 0.5817661 0.0084798
Sensibilidad subpoblación 3 0.7583134 0.0059969
Especificidad subpoblación 3 0.5807136 0.0083457
Sensibilidad subpoblación 4 0.7603797 0.0068248
Especificidad subpoblación 4 0.5849011 0.0077114

Analizando conjuntamente la sensibilidad y le especificidad por subpoblaciones:







Simulación n=75

Se generan 1000 tablas \(4 \times 4\) con las mismas probabilidades y tamaƱo de muestra.

El promedio y la varianza de los betas estimados para este caso serĆ­a:

Betas estimados
Promedio Varianza
\(\beta_0\) 0.7676934 0.0037295
\(\beta_1^{(1)}\) 0.0007231 0.0048010
\(\beta_1^{(2)}\) 0.0006568 0.0042795
\(\beta_0^{(,2)}\) -0.1834477 0.0069287
\(\beta_1^{(1,2)}\) -0.0003209 0.0099809
\(\beta_1^{(2,2)}\) -0.0010231 0.0100143

Distribución de los betas

Confirmamos si la distribución de todos los betas es normal realizando el test de Shapiro Wilk multivariado.

## 
##  Generalized Shapiro-Wilk test for Multivariate Normality by
##  Villasenor-Alva and Gonzalez-Estrada
## 
## data:  as.matrix(t(Betas_resu$Betas))
## MVW = 0.99573, p-value = 3.047e-08

Como el \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad multivariada entre los betas.

Analizamos la normalidad de cada beta de forma marginal (o individual)

Valor P Test Shapiro univariado normalidad
\(\beta_0\) \(\beta_1^{(1)}\) \(\beta_1^{(2)}\) \(\beta_0^{(,2)}\) \(\beta_1^{(1,2)}\) \(\beta_1^{(2,2)}\)
0.4181928 3.12e-05 0.0044683 0.0040421 0.0139536 0.7728797

Criterio: \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad univariada en beta. \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto sĆ­ hay normalidad univariada en beta.

Analizando la sensibilidad y especificidad por subpoblación.

El promedio y la varianza de la sensibilidad y especificidad por subppoblación sería:

Sensibilidad y especificidad estimadas
Promedio Varianza
Sensibilidad subpoblación 1 0.7676934 0.0037295
Especificidad subpoblación 1 0.5842456 0.0051760
Sensibilidad subpoblación 2 0.7683502 0.0039013
Especificidad subpoblación 2 0.5838793 0.0056962
Sensibilidad subpoblación 3 0.7684164 0.0039194
Especificidad subpoblación 3 0.5846478 0.0055597
Sensibilidad subpoblación 4 0.7690732 0.0037349
Especificidad subpoblación 4 0.5842815 0.0057016

Analizando conjuntamente la sensibilidad y le especificidad por subpoblaciones:







Simulación n=100

Se generan 1000 tablas \(4 \times 4\) con las mismas probabilidades y tamaƱo de muestra.

El promedio y la varianza de los betas estimados para este caso serĆ­a:

Betas estimados
Promedio Varianza
\(\beta_0\) 0.7740343 0.0027288
\(\beta_1^{(1)}\) 0.0004750 0.0032898
\(\beta_1^{(2)}\) 0.0019464 0.0031739
\(\beta_0^{(,2)}\) -0.1832977 0.0058630
\(\beta_1^{(1,2)}\) -0.0027473 0.0077015
\(\beta_1^{(2,2)}\) -0.0054565 0.0080913

Distribución de los betas

Confirmamos si la distribución de todos los betas es normal realizando el test de Shapiro Wilk multivariado.

## 
##  Generalized Shapiro-Wilk test for Multivariate Normality by
##  Villasenor-Alva and Gonzalez-Estrada
## 
## data:  as.matrix(t(Betas_resu$Betas))
## MVW = 0.99731, p-value = 0.003509

Como el \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad multivariada entre los betas.

Analizamos la normalidad de cada beta de forma marginal (o individual)

Valor P Test Shapiro univariado normalidad
\(\beta_0\) \(\beta_1^{(1)}\) \(\beta_1^{(2)}\) \(\beta_0^{(,2)}\) \(\beta_1^{(1,2)}\) \(\beta_1^{(2,2)}\)
0.0204616 0.5406353 0.0308985 4.82e-05 0.4346922 0.0754158

Criterio: \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad univariada en beta. \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto sĆ­ hay normalidad univariada en beta.

Analizando la sensibilidad y especificidad por subpoblación.

El promedio y la varianza de la sensibilidad y especificidad por subppoblación sería:

Sensibilidad y especificidad estimadas
Promedio Varianza
Sensibilidad subpoblación 1 0.7740343 0.0027288
Especificidad subpoblación 1 0.5907366 0.0041569
Sensibilidad subpoblación 2 0.7759807 0.0026007
Especificidad subpoblación 2 0.5872265 0.0045968
Sensibilidad subpoblación 3 0.7745093 0.0025446
Especificidad subpoblación 3 0.5884643 0.0046260
Sensibilidad subpoblación 4 0.7764557 0.0026994
Especificidad subpoblación 4 0.5849542 0.0041190

Analizando conjuntamente la sensibilidad y le especificidad por subpoblaciones:







Simulación n=301

Se generan 1000 tablas \(4 \times 4\) con las mismas probabilidades y tamaƱo de muestra. Probabilidades \(0.4,0.1,0.2,0.3\)

El promedio y la varianza de los betas estimados para este caso serĆ­a:

Betas estimados
Promedio Varianza
\(\beta_0\) 0.7917129 0.0009293
\(\beta_1^{(1)}\) -0.0005770 0.0010422
\(\beta_1^{(2)}\) -0.0009502 0.0011136
\(\beta_0^{(,2)}\) -0.1954957 0.0019603
\(\beta_1^{(1,2)}\) 0.0041229 0.0026115
\(\beta_1^{(2,2)}\) 0.0013556 0.0023813

Distribución de los betas

Confirmamos si la distribución de todos los betas es normal realizando el test de Shapiro Wilk multivariado.

## 
##  Generalized Shapiro-Wilk test for Multivariate Normality by
##  Villasenor-Alva and Gonzalez-Estrada
## 
## data:  as.matrix(t(Betas_resu$Betas))
## MVW = 0.99827, p-value = 0.4473

Como el \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto hay normalidad multivariada entre los betas.

Analizamos la normalidad de cada beta de forma marginal (o individual)

Valor P Test Shapiro univariado normalidad
\(\beta_0\) \(\beta_1^{(1)}\) \(\beta_1^{(2)}\) \(\beta_0^{(,2)}\) \(\beta_1^{(1,2)}\) \(\beta_1^{(2,2)}\)
0.2687876 0.295454 0.4806772 0.9391675 0.4597041 0.8571346

Criterio: \(p\)- valor \(<0.05\) rechazamos \(H_{0}\), por tanto no hay normalidad univariada en beta. \(p\)- valor \(>0.05\) aceptamos \(H_{0}\), por tanto sĆ­ hay normalidad univariada en beta.

Analizando la sensibilidad y especificidad por subpoblación.

El promedio y la varianza de la sensibilidad y especificidad por subppoblación sería:

Sensibilidad y especificidad estimadas
Promedio Varianza
Sensibilidad subpoblación 1 0.7917129 0.0009293
Especificidad subpoblación 1 0.5962172 0.0011554
Sensibilidad subpoblación 2 0.7907627 0.0009019
Especificidad subpoblación 2 0.5966226 0.0010930
Sensibilidad subpoblación 3 0.7911359 0.0008333
Especificidad subpoblación 3 0.5997631 0.0011465
Sensibilidad subpoblación 4 0.7901857 0.0008789
Especificidad subpoblación 4 0.6001685 0.0011877

Analizando conjuntamente la sensibilidad y le especificidad por subpoblaciones:

Distancia Kullback-Leibler

Probabilidades escenario 2: \(p=(0.4,0.1,0.2,0.3)\)

Probabilidades escenario 3: \(p = \left( \frac{7}{15}, \frac{7}{60}, \frac{1}{6}, \frac{1}{4}\right) \approx (0.47, 0.12, 0.17, 0.25)\)

px <- c(0.4,0.1,0.2,0.3)
py <- c(7/15, 7/60, 1/6, 1/4)

sum(px*log2(px/py))
## [1] 0.02032099