Tema 1

Genere y ejecute una simulación para estimar el evento más probable dado el experimento aleatorio de interés http://rmarkdown.rstudio.com

Ejemplo: extraer sucesivamente y sin reposición dos bolillas de una urna que contiene 5 bolillas blancas y 3 rojas. Si las bolillas están enumeradas del 1 al 5 (las blancas) y del 1 al 3 (las rojas) y la intensión del experimento es estimar la probabilidad de obtener una suma impar.

#Solución matemática
#Espacio muestral
canica1=c(1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,5,5,5,5)
canica2=c(1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,5,1,2,3,4)
doscan=data.frame(canica1,canica2)
doscan
##    canica1 canica2
## 1        1       1
## 2        1       2
## 3        1       3
## 4        1       4
## 5        1       5
## 6        2       1
## 7        2       2
## 8        2       3
## 9        2       4
## 10       2       5
## 11       3       1
## 12       3       2
## 13       3       3
## 14       3       4
## 15       3       5
## 16       4       1
## 17       4       2
## 18       4       3
## 19       4       5
## 20       5       1
## 21       5       2
## 22       5       3
## 23       5       4
library(gtools) # esta librería permite controlar si un numero es par o impar
doscan$sumacan=doscan$canica1+doscan$canica2
doscan
##    canica1 canica2 sumacan
## 1        1       1       2
## 2        1       2       3
## 3        1       3       4
## 4        1       4       5
## 5        1       5       6
## 6        2       1       3
## 7        2       2       4
## 8        2       3       5
## 9        2       4       6
## 10       2       5       7
## 11       3       1       4
## 12       3       2       5
## 13       3       3       6
## 14       3       4       7
## 15       3       5       8
## 16       4       1       5
## 17       4       2       6
## 18       4       3       7
## 19       4       5       9
## 20       5       1       6
## 21       5       2       7
## 22       5       3       8
## 23       5       4       9
doscan$esimpar=odd(doscan$sumacan)
doscan
##    canica1 canica2 sumacan esimpar
## 1        1       1       2   FALSE
## 2        1       2       3    TRUE
## 3        1       3       4   FALSE
## 4        1       4       5    TRUE
## 5        1       5       6   FALSE
## 6        2       1       3    TRUE
## 7        2       2       4   FALSE
## 8        2       3       5    TRUE
## 9        2       4       6   FALSE
## 10       2       5       7    TRUE
## 11       3       1       4   FALSE
## 12       3       2       5    TRUE
## 13       3       3       6   FALSE
## 14       3       4       7    TRUE
## 15       3       5       8   FALSE
## 16       4       1       5    TRUE
## 17       4       2       6   FALSE
## 18       4       3       7    TRUE
## 19       4       5       9    TRUE
## 20       5       1       6   FALSE
## 21       5       2       7    TRUE
## 22       5       3       8   FALSE
## 23       5       4       9    TRUE
table(doscan$esimpar)
## 
## FALSE  TRUE 
##    11    12
prop.table(table(doscan$esimpar))
## 
##     FALSE      TRUE 
## 0.4782609 0.5217391

La probabilida real de obtener un suma impar es del 52,17391 %

odd(4) #es impar
## [1] FALSE
even(4) # es par
## [1] TRUE

Tema 2

Tema de interes de la Encuesta de Hogares: Población enferma de COVID entre hombres y mujeres

Pregunta: Enfermedad que tuvo en los últimos 90 días_C
Variables:

S03C Categorías: Resfrío, gripe, influenza (1) Bronquitis(2) Neumonía o pulmonía(3) Coronavirus (COVID 19)(4) Dengue / Zika / Chikungunya(5) Otro (especificar)(6) NR(9) NA

1 2 3 4 6

Género: P06

Factor de expansión: FEX

Verificar si la proporción de hombres y mujeres mayores a 50 años que declararon haber tenido COVID en los ultimos 90 dias son iguales

Hipótesis:

Hipótesis nula: la proporción de hombres y mujeres mayores a 50 años que declararon haber tenido COVID en los ultimos 90 dias son iguales

Hipótesis alterna: la proporción de hombres y mujeres mayores a 50 años que declararon haber tenido COVID en los ultimos 90 dias son diferentes

Descarga de la base de datos

url="https://www.ine.gov.py/datos/encuestas/eph/Poblacion/EPH-2021/data/9e824reg02_ephc2021.csv"
download.file(url,"EPH2021.csv")

Leer los microdatos

eph2021=read.csv("EPH2021.csv",sep =";")
#View

Seleccionamos las variables de interes

eph2021s <- subset(eph2021, select = c("P06", "S03A","P02","FEX"))
eph2021s$year <- 2021
names(eph2021s)
## [1] "P06"  "S03A" "P02"  "FEX"  "year"
table(eph2021s$S03A)
## 
##    1    2    3    4    5    6    9 
## 1697   16   23  164    3 1384    8
eph2021s$P06 <- factor(eph2021s$P06, labels = c("Hombres", "Mujeres"))
eph2021s$S03A <- factor(eph2021s$S03A, labels = c("Gripe", "Bronquitis", "Neumonía","COVID","Dengue","Otro","NR"))
table(eph2021s$P06)
## 
## Hombres Mujeres 
##    8149    8420
# una gráfica para sexo
pie(table(eph2021s$P06),labels = c("Hombres","Mujeres"), main="Pie Chart",edges = 200)

prop.table(table(eph2021s$P06))
## 
##   Hombres   Mujeres 
## 0.4918221 0.5081779
table(eph2021s$S03A,eph2021s$P06)
##             
##              Hombres Mujeres
##   Gripe          805     892
##   Bronquitis      10       6
##   Neumonía        10      13
##   COVID           77      87
##   Dengue           2       1
##   Otro           530     854
##   NR               5       3
eph2021scovid <- subset(eph2021,P02>50 & S03A==4, select =  c("P06", "S03A","P02","FEX"))
eph2021scovid$year <- 2021
names(eph2021scovid)
## [1] "P06"  "S03A" "P02"  "FEX"  "year"
#View(eph2021scovid)
table(eph2021scovid$S03A)
## 
##  4 
## 50
eph2021scovid$S03A <- factor(eph2021scovid$S03A, labels = c("COVID"))
eph2021scovid$P06 <- factor(eph2021scovid$P06, labels = c("Hombres", "Mujeres"))
table(eph2021scovid$S03A,eph2021scovid$P06)
##        
##         Hombres Mujeres
##   COVID      24      26
tab1=addmargins(table(eph2021scovid$P06,eph2021scovid$S03A),margin = c(1,2))
tab1
##          
##           COVID Sum
##   Hombres    24  24
##   Mujeres    26  26
##   Sum        50  50
porcHomCovid=24/50
porcHomCovid
## [1] 0.48
porcMujCovid=26/50
porcMujCovid
## [1] 0.52
chisq.test(table(eph2021scovid$P06,eph2021scovid$S03A))
## 
##  Chi-squared test for given probabilities
## 
## data:  table(eph2021scovid$P06, eph2021scovid$S03A)
## X-squared = 0.08, df = 1, p-value = 0.7773
#Valores poblacionales
library("dplyr")
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
eph2021s %>%
 group_by(S03A,P06) %>%
  summarise(nroenfcovid=sum(FEX))
## `summarise()` has grouped output by 'S03A'. You can override using the
## `.groups` argument.
## # A tibble: 16 × 3
## # Groups:   S03A [8]
##    S03A       P06     nroenfcovid
##    <fct>      <fct>         <int>
##  1 Gripe      Hombres      371389
##  2 Gripe      Mujeres      382552
##  3 Bronquitis Hombres        3208
##  4 Bronquitis Mujeres        2417
##  5 Neumonía   Hombres        4200
##  6 Neumonía   Mujeres        4711
##  7 COVID      Hombres       34170
##  8 COVID      Mujeres       34930
##  9 Dengue     Hombres        1567
## 10 Dengue     Mujeres         456
## 11 Otro       Hombres      212175
## 12 Otro       Mujeres      326115
## 13 NR         Hombres        2432
## 14 NR         Mujeres         997
## 15 <NA>       Hombres     3028199
## 16 <NA>       Mujeres     2856925
#View(eph2021s)
str(eph2021)
## 'data.frame':    16569 obs. of  257 variables:
##  $ UPM                : int  106 106 106 106 106 106 106 106 106 106 ...
##  $ NVIVI              : int  1 1 1 3 3 3 3 3 3 3 ...
##  $ NHOGA              : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ DPTOREP            : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ AREA               : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ L02                : int  1 2 3 2 3 4 5 6 7 8 ...
##  $ P02                : int  71 66 29 64 24 38 11 5 7 6 ...
##  $ P03                : int  1 2 3 1 3 3 5 5 5 5 ...
##  $ P04                : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ P04A               : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ P04B               : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ P05C               : int  2 1 0 0 0 0 0 0 0 0 ...
##  $ P05P               : int  0 0 1 0 0 0 0 0 0 0 ...
##  $ P05M               : int  0 0 2 0 2 2 4 4 0 0 ...
##  $ P06                : int  1 6 1 6 1 6 6 1 6 6 ...
##  $ P08D               : int  30 24 7 27 21 14 8 20 4 20 ...
##  $ P08M               : int  5 4 7 11 8 11 11 10 2 6 ...
##  $ P08A               : int  1950 1955 1992 1956 1997 1982 2009 2015 2014 2015 ...
##  $ P09                : int  1 1 5 4 5 5 5 5 5 5 ...
##  $ P10A               : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ P10AB              : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ P10Z               : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ P11A               : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ P11AB              : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ P11Z               : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ P12                : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ A01                : int  1 6 6 1 1 1 6 NA NA NA ...
##  $ A01A               : int  NA 1 1 NA NA NA 4 NA NA NA ...
##  $ A02                : int  6 6 1 1 1 6 6 NA NA NA ...
##  $ A03                : int  6 6 NA NA NA 6 6 NA NA NA ...
##  $ A04                : int  6 6 NA NA NA 6 6 NA NA NA ...
##  $ A04B               : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ A04A               : int  NA NA 1 1 1 NA NA NA NA NA ...
##  $ A05                : int  6 6 NA NA NA 1 6 NA NA NA ...
##  $ A07                : int  NA NA NA NA NA 1 NA NA NA NA ...
##  $ A08                : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ A10                : int  NA NA NA NA NA 4 NA NA NA NA ...
##  $ A11A               : int  NA NA NA NA NA 0 NA NA NA NA ...
##  $ A11M               : int  NA NA NA NA NA 0 NA NA NA NA ...
##  $ A11S               : int  NA NA NA NA NA 2 NA NA NA NA ...
##  $ A12                : int  1 1 NA NA NA 1 6 NA NA NA ...
##  $ A13REC             : int  9 5 NA NA NA 9 NA NA NA NA ...
##  $ A14REC             : int  2 5 NA NA NA 7 NA NA NA NA ...
##  $ A15                : int  2 2 NA NA NA 2 NA NA NA NA ...
##  $ A16                : int  9 11 NA NA NA 7 NA NA NA NA ...
##  $ A17A               : int  25 26 NA NA NA 0 NA NA NA NA ...
##  $ A17M               : int  0 0 NA NA NA 2 NA NA NA NA ...
##  $ A17S               : int  0 0 NA NA NA 0 NA NA NA NA ...
##  $ A18                : int  8 3 NA NA NA 3 NA NA NA NA ...
##  $ A18A               : int  NA 6 NA NA NA 1 NA NA NA NA ...
##  $ B01REC             : int  NA NA 7 5 4 NA NA NA NA NA ...
##  $ B02REC             : int  NA NA 2 5 6 NA NA NA NA NA ...
##  $ B03LU              : chr  " " " " "8" "4" ...
##  $ B03MA              : chr  " " " " "8" "4" ...
##  $ B03MI              : chr  " " " " "8" "4" ...
##  $ B03JU              : chr  " " " " "8" "4" ...
##  $ B03VI              : chr  " " " " "8" "4" ...
##  $ B03SA              : chr  " " " " "5" "4" ...
##  $ B03DO              : chr  " " " " "0" "1" ...
##  $ B04                : int  NA NA 1 1 1 NA NA NA NA NA ...
##  $ B05                : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ B05A               : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ B06                : chr  " " " " " " " " ...
##  $ B07A               : int  NA NA 15 30 1 NA NA NA NA NA ...
##  $ B07M               : int  NA NA 0 0 2 NA NA NA NA NA ...
##  $ B07S               : int  NA NA 0 0 0 NA NA NA NA NA ...
##  $ B08                : int  NA NA 2 1 5 NA NA NA NA NA ...
##  $ B09A               : int  NA NA 0 30 1 NA NA NA NA NA ...
##  $ B09M               : int  NA NA 6 0 2 NA NA NA NA NA ...
##  $ B09S               : int  NA NA 0 0 0 NA NA NA NA NA ...
##  $ B10                : int  NA NA 6 6 1 NA NA NA NA NA ...
##  $ B11                : int  NA NA NA NA 1 NA NA NA NA NA ...
##  $ B12                : int  NA NA 2 4 2 NA NA NA NA NA ...
##  $ B12A               : int  NA NA 6 NA 6 NA NA NA NA NA ...
##  $ B12B               : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ B12C               : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ B13                : int  NA NA 88 NA 12 NA NA NA NA NA ...
##  $ B14                : int  NA NA 1 NA 1 NA NA NA NA NA ...
##  $ B15                : int  NA NA 4 NA 4 NA NA NA NA NA ...
##  $ B16G               : num  NA NA 700000 NA 2350000 NA NA NA NA NA ...
##  $ B16U               : int  NA NA 3 NA 5 NA NA NA NA NA ...
##  $ B16D               : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ B16T               : num  NA NA 2800000 NA 2350000 NA NA NA NA NA ...
##  $ B17                : int  NA NA 6 NA 6 NA NA NA NA NA ...
##  $ B18AG              : num  NA NA NA NA NA NA NA NA NA NA ...
##  $ B18AU              : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ B18BG              : num  NA NA NA NA NA NA NA NA NA NA ...
##  $ B18BU              : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ B19                : int  NA NA 6 NA 6 NA NA NA NA NA ...
##  $ B20G               : num  NA NA NA NA NA NA NA NA NA NA ...
##  $ B20U               : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ B20D               : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ B20T               : num  NA NA NA NA NA NA NA NA NA NA ...
##  $ B21                : int  NA NA 6 NA 6 NA NA NA NA NA ...
##  $ B22                : num  NA NA NA NA NA NA NA NA NA NA ...
##  $ B23                : num  NA NA NA NA NA NA NA NA NA NA ...
##  $ B24                : int  NA NA 6 NA 6 NA NA NA NA NA ...
##  $ B25                : num  NA NA NA NA NA NA NA NA NA NA ...
##  $ B26                : int  NA NA 4 NA 1 NA NA NA NA NA ...
##   [list output truncated]
names(eph2021)
##   [1] "UPM"                 "NVIVI"               "NHOGA"              
##   [4] "DPTOREP"             "AREA"                "L02"                
##   [7] "P02"                 "P03"                 "P04"                
##  [10] "P04A"                "P04B"                "P05C"               
##  [13] "P05P"                "P05M"                "P06"                
##  [16] "P08D"                "P08M"                "P08A"               
##  [19] "P09"                 "P10A"                "P10AB"              
##  [22] "P10Z"                "P11A"                "P11AB"              
##  [25] "P11Z"                "P12"                 "A01"                
##  [28] "A01A"                "A02"                 "A03"                
##  [31] "A04"                 "A04B"                "A04A"               
##  [34] "A05"                 "A07"                 "A08"                
##  [37] "A10"                 "A11A"                "A11M"               
##  [40] "A11S"                "A12"                 "A13REC"             
##  [43] "A14REC"              "A15"                 "A16"                
##  [46] "A17A"                "A17M"                "A17S"               
##  [49] "A18"                 "A18A"                "B01REC"             
##  [52] "B02REC"              "B03LU"               "B03MA"              
##  [55] "B03MI"               "B03JU"               "B03VI"              
##  [58] "B03SA"               "B03DO"               "B04"                
##  [61] "B05"                 "B05A"                "B06"                
##  [64] "B07A"                "B07M"                "B07S"               
##  [67] "B08"                 "B09A"                "B09M"               
##  [70] "B09S"                "B10"                 "B11"                
##  [73] "B12"                 "B12A"                "B12B"               
##  [76] "B12C"                "B13"                 "B14"                
##  [79] "B15"                 "B16G"                "B16U"               
##  [82] "B16D"                "B16T"                "B17"                
##  [85] "B18AG"               "B18AU"               "B18BG"              
##  [88] "B18BU"               "B19"                 "B20G"               
##  [91] "B20U"                "B20D"                "B20T"               
##  [94] "B21"                 "B22"                 "B23"                
##  [97] "B24"                 "B25"                 "B26"                
## [100] "B271"                "B272"                "B28"                
## [103] "B29"                 "B30"                 "B31"                
## [106] "C01REC"              "C02REC"              "C03"                
## [109] "C04"                 "C05"                 "C06"                
## [112] "C07"                 "C08"                 "C09"                
## [115] "C101"                "C102"                "C11G"               
## [118] "C11U"                "C11D"                "C11T"               
## [121] "C12"                 "C13AG"               "C13AU"              
## [124] "C13BG"               "C13BU"               "C14"                
## [127] "C14A"                "C14B"                "C14C"               
## [130] "C15"                 "C16REC"              "C17REC"             
## [133] "C18"                 "C18A"                "C18B"               
## [136] "C19"                 "D01"                 "D02"                
## [139] "D03"                 "D04"                 "D05"                
## [142] "E01A"                "E01B"                "E01C"               
## [145] "E01D"                "E01E"                "E01F"               
## [148] "E01G"                "E01H"                "E01I"               
## [151] "E01J"                "E01K"                "E01L"               
## [154] "E01M"                "E02D1"               "E02D2"              
## [157] "E02B"                "ED01"                "ED02"               
## [160] "ED03"                "ED0504"              "ED06C"              
## [163] "ED08"                "ED09"                "ED10"               
## [166] "ED11F1"              "ED11F1A"             "ED11GH1"            
## [169] "ED11GH1A"            "ED12"                "ED13"               
## [172] "ED14"                "ED14A"               "ED15"               
## [175] "S01A"                "S01B"                "S02"                
## [178] "S03"                 "S03A"                "S03B"               
## [181] "S03C"                "S04"                 "S05"                
## [184] "S06"                 "S07"                 "S08"                
## [187] "S09"                 "CATE_PEA"            "TAMA_PEA"           
## [190] "OCUP_PEA"            "RAMA_PEA"            "HORAB"              
## [193] "HORABC"              "HORABCO"             "PEAD"               
## [196] "PEAA"                "TIPOHOGA"            "FEX"                
## [199] "NJEF"                "NCON"                "NPAD"               
## [202] "NMAD"                "TIC01"               "TIC02"              
## [205] "TIC03"               "TIC0401"             "TIC0402"            
## [208] "TIC0403"             "TIC0404"             "TIC0405"            
## [211] "TIC0406"             "TIC0407"             "TIC0408"            
## [214] "TIC0409"             "TIC0501"             "TIC0502"            
## [217] "TIC0503"             "TIC0504"             "TIC0505"            
## [220] "TIC0506"             "TIC0507"             "TIC0508"            
## [223] "TIC0509"             "TIC0510"             "TIC0511"            
## [226] "TIC0512"             "TIC0513"             "TIC06"              
## [229] "TIC07"               "añoest"              "ra06ya09"           
## [232] "e01aimde"            "e01bimde"            "e01cimde"           
## [235] "e01dde"              "e01ede"              "e01fde"             
## [238] "e01gde"              "e01hde"              "e01ide"             
## [241] "e01jde"              "e01kde"              "e01lde"             
## [244] "e01mde"              "e01kjde"             "e02bde"             
## [247] "ingrevasode"         "ingrepytyvõde"       "ingresect_privadode"
## [250] "ipcm"                "pobrezai"            "pobnopoi"           
## [253] "quintili"            "decili"              "quintiai"           
## [256] "decilai"             "informalidad"