Genere y ejecute una simulación para estimar el evento más probable dado el experimento aleatorio de interés http://rmarkdown.rstudio.com
Ejemplo: extraer sucesivamente y sin reposición dos bolillas de una urna que contiene 5 bolillas blancas y 3 rojas. Si las bolillas están enumeradas del 1 al 5 (las blancas) y del 1 al 3 (las rojas) y la intensión del experimento es estimar la probabilidad de obtener una suma impar.
#Solución matemática
#Espacio muestral
canica1=c(1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,5,5,5,5)
canica2=c(1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,5,1,2,3,4)
doscan=data.frame(canica1,canica2)
doscan
## canica1 canica2
## 1 1 1
## 2 1 2
## 3 1 3
## 4 1 4
## 5 1 5
## 6 2 1
## 7 2 2
## 8 2 3
## 9 2 4
## 10 2 5
## 11 3 1
## 12 3 2
## 13 3 3
## 14 3 4
## 15 3 5
## 16 4 1
## 17 4 2
## 18 4 3
## 19 4 5
## 20 5 1
## 21 5 2
## 22 5 3
## 23 5 4
library(gtools) # esta librería permite controlar si un numero es par o impar
doscan$sumacan=doscan$canica1+doscan$canica2
doscan
## canica1 canica2 sumacan
## 1 1 1 2
## 2 1 2 3
## 3 1 3 4
## 4 1 4 5
## 5 1 5 6
## 6 2 1 3
## 7 2 2 4
## 8 2 3 5
## 9 2 4 6
## 10 2 5 7
## 11 3 1 4
## 12 3 2 5
## 13 3 3 6
## 14 3 4 7
## 15 3 5 8
## 16 4 1 5
## 17 4 2 6
## 18 4 3 7
## 19 4 5 9
## 20 5 1 6
## 21 5 2 7
## 22 5 3 8
## 23 5 4 9
doscan$esimpar=odd(doscan$sumacan)
doscan
## canica1 canica2 sumacan esimpar
## 1 1 1 2 FALSE
## 2 1 2 3 TRUE
## 3 1 3 4 FALSE
## 4 1 4 5 TRUE
## 5 1 5 6 FALSE
## 6 2 1 3 TRUE
## 7 2 2 4 FALSE
## 8 2 3 5 TRUE
## 9 2 4 6 FALSE
## 10 2 5 7 TRUE
## 11 3 1 4 FALSE
## 12 3 2 5 TRUE
## 13 3 3 6 FALSE
## 14 3 4 7 TRUE
## 15 3 5 8 FALSE
## 16 4 1 5 TRUE
## 17 4 2 6 FALSE
## 18 4 3 7 TRUE
## 19 4 5 9 TRUE
## 20 5 1 6 FALSE
## 21 5 2 7 TRUE
## 22 5 3 8 FALSE
## 23 5 4 9 TRUE
table(doscan$esimpar)
##
## FALSE TRUE
## 11 12
prop.table(table(doscan$esimpar))
##
## FALSE TRUE
## 0.4782609 0.5217391
La probabilida real de obtener un suma impar es del 52,17391 %
odd(4) #es impar
## [1] FALSE
even(4) # es par
## [1] TRUE
Pregunta: Enfermedad que tuvo en los últimos 90 días_C
Variables:
S03C Categorías: Resfrío, gripe, influenza (1) Bronquitis(2) Neumonía o pulmonía(3) Coronavirus (COVID 19)(4) Dengue / Zika / Chikungunya(5) Otro (especificar)(6) NR(9) NA
1 2 3 4 6
Género: P06
Factor de expansión: FEX
Verificar si la proporción de hombres y mujeres mayores a 50 años que declararon haber tenido COVID en los ultimos 90 dias son iguales
Hipótesis nula: la proporción de hombres y mujeres mayores a 50 años que declararon haber tenido COVID en los ultimos 90 dias son iguales
Hipótesis alterna: la proporción de hombres y mujeres mayores a 50 años que declararon haber tenido COVID en los ultimos 90 dias son diferentes
url="https://www.ine.gov.py/datos/encuestas/eph/Poblacion/EPH-2021/data/9e824reg02_ephc2021.csv"
download.file(url,"EPH2021.csv")
eph2021=read.csv("EPH2021.csv",sep =";")
#View
eph2021s <- subset(eph2021, select = c("P06", "S03A","P02","FEX"))
eph2021s$year <- 2021
names(eph2021s)
## [1] "P06" "S03A" "P02" "FEX" "year"
table(eph2021s$S03A)
##
## 1 2 3 4 5 6 9
## 1697 16 23 164 3 1384 8
eph2021s$P06 <- factor(eph2021s$P06, labels = c("Hombres", "Mujeres"))
eph2021s$S03A <- factor(eph2021s$S03A, labels = c("Gripe", "Bronquitis", "Neumonía","COVID","Dengue","Otro","NR"))
table(eph2021s$P06)
##
## Hombres Mujeres
## 8149 8420
# una gráfica para sexo
pie(table(eph2021s$P06),labels = c("Hombres","Mujeres"), main="Pie Chart",edges = 200)
prop.table(table(eph2021s$P06))
##
## Hombres Mujeres
## 0.4918221 0.5081779
table(eph2021s$S03A,eph2021s$P06)
##
## Hombres Mujeres
## Gripe 805 892
## Bronquitis 10 6
## Neumonía 10 13
## COVID 77 87
## Dengue 2 1
## Otro 530 854
## NR 5 3
eph2021scovid <- subset(eph2021,P02>50 & S03A==4, select = c("P06", "S03A","P02","FEX"))
eph2021scovid$year <- 2021
names(eph2021scovid)
## [1] "P06" "S03A" "P02" "FEX" "year"
#View(eph2021scovid)
table(eph2021scovid$S03A)
##
## 4
## 50
eph2021scovid$S03A <- factor(eph2021scovid$S03A, labels = c("COVID"))
eph2021scovid$P06 <- factor(eph2021scovid$P06, labels = c("Hombres", "Mujeres"))
table(eph2021scovid$S03A,eph2021scovid$P06)
##
## Hombres Mujeres
## COVID 24 26
tab1=addmargins(table(eph2021scovid$P06,eph2021scovid$S03A),margin = c(1,2))
tab1
##
## COVID Sum
## Hombres 24 24
## Mujeres 26 26
## Sum 50 50
porcHomCovid=24/50
porcHomCovid
## [1] 0.48
porcMujCovid=26/50
porcMujCovid
## [1] 0.52
chisq.test(table(eph2021scovid$P06,eph2021scovid$S03A))
##
## Chi-squared test for given probabilities
##
## data: table(eph2021scovid$P06, eph2021scovid$S03A)
## X-squared = 0.08, df = 1, p-value = 0.7773
#Valores poblacionales
library("dplyr")
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
eph2021s %>%
group_by(S03A,P06) %>%
summarise(nroenfcovid=sum(FEX))
## `summarise()` has grouped output by 'S03A'. You can override using the
## `.groups` argument.
## # A tibble: 16 × 3
## # Groups: S03A [8]
## S03A P06 nroenfcovid
## <fct> <fct> <int>
## 1 Gripe Hombres 371389
## 2 Gripe Mujeres 382552
## 3 Bronquitis Hombres 3208
## 4 Bronquitis Mujeres 2417
## 5 Neumonía Hombres 4200
## 6 Neumonía Mujeres 4711
## 7 COVID Hombres 34170
## 8 COVID Mujeres 34930
## 9 Dengue Hombres 1567
## 10 Dengue Mujeres 456
## 11 Otro Hombres 212175
## 12 Otro Mujeres 326115
## 13 NR Hombres 2432
## 14 NR Mujeres 997
## 15 <NA> Hombres 3028199
## 16 <NA> Mujeres 2856925
#View(eph2021s)
str(eph2021)
## 'data.frame': 16569 obs. of 257 variables:
## $ UPM : int 106 106 106 106 106 106 106 106 106 106 ...
## $ NVIVI : int 1 1 1 3 3 3 3 3 3 3 ...
## $ NHOGA : int 1 1 1 1 1 1 1 1 1 1 ...
## $ DPTOREP : int 0 0 0 0 0 0 0 0 0 0 ...
## $ AREA : int 1 1 1 1 1 1 1 1 1 1 ...
## $ L02 : int 1 2 3 2 3 4 5 6 7 8 ...
## $ P02 : int 71 66 29 64 24 38 11 5 7 6 ...
## $ P03 : int 1 2 3 1 3 3 5 5 5 5 ...
## $ P04 : int 1 1 1 1 1 1 1 1 1 1 ...
## $ P04A : int 1 1 1 1 1 1 1 1 1 1 ...
## $ P04B : int NA NA NA NA NA NA NA NA NA NA ...
## $ P05C : int 2 1 0 0 0 0 0 0 0 0 ...
## $ P05P : int 0 0 1 0 0 0 0 0 0 0 ...
## $ P05M : int 0 0 2 0 2 2 4 4 0 0 ...
## $ P06 : int 1 6 1 6 1 6 6 1 6 6 ...
## $ P08D : int 30 24 7 27 21 14 8 20 4 20 ...
## $ P08M : int 5 4 7 11 8 11 11 10 2 6 ...
## $ P08A : int 1950 1955 1992 1956 1997 1982 2009 2015 2014 2015 ...
## $ P09 : int 1 1 5 4 5 5 5 5 5 5 ...
## $ P10A : int 0 0 0 0 0 0 0 0 0 0 ...
## $ P10AB : int 0 0 0 0 0 0 0 0 0 0 ...
## $ P10Z : int 1 1 1 1 1 1 1 1 1 1 ...
## $ P11A : int 0 0 0 0 0 0 0 0 0 0 ...
## $ P11AB : int 0 0 0 0 0 0 0 0 0 0 ...
## $ P11Z : int 1 1 1 1 1 1 1 1 1 1 ...
## $ P12 : int NA NA NA NA NA NA NA NA NA NA ...
## $ A01 : int 1 6 6 1 1 1 6 NA NA NA ...
## $ A01A : int NA 1 1 NA NA NA 4 NA NA NA ...
## $ A02 : int 6 6 1 1 1 6 6 NA NA NA ...
## $ A03 : int 6 6 NA NA NA 6 6 NA NA NA ...
## $ A04 : int 6 6 NA NA NA 6 6 NA NA NA ...
## $ A04B : int NA NA NA NA NA NA NA NA NA NA ...
## $ A04A : int NA NA 1 1 1 NA NA NA NA NA ...
## $ A05 : int 6 6 NA NA NA 1 6 NA NA NA ...
## $ A07 : int NA NA NA NA NA 1 NA NA NA NA ...
## $ A08 : int NA NA NA NA NA NA NA NA NA NA ...
## $ A10 : int NA NA NA NA NA 4 NA NA NA NA ...
## $ A11A : int NA NA NA NA NA 0 NA NA NA NA ...
## $ A11M : int NA NA NA NA NA 0 NA NA NA NA ...
## $ A11S : int NA NA NA NA NA 2 NA NA NA NA ...
## $ A12 : int 1 1 NA NA NA 1 6 NA NA NA ...
## $ A13REC : int 9 5 NA NA NA 9 NA NA NA NA ...
## $ A14REC : int 2 5 NA NA NA 7 NA NA NA NA ...
## $ A15 : int 2 2 NA NA NA 2 NA NA NA NA ...
## $ A16 : int 9 11 NA NA NA 7 NA NA NA NA ...
## $ A17A : int 25 26 NA NA NA 0 NA NA NA NA ...
## $ A17M : int 0 0 NA NA NA 2 NA NA NA NA ...
## $ A17S : int 0 0 NA NA NA 0 NA NA NA NA ...
## $ A18 : int 8 3 NA NA NA 3 NA NA NA NA ...
## $ A18A : int NA 6 NA NA NA 1 NA NA NA NA ...
## $ B01REC : int NA NA 7 5 4 NA NA NA NA NA ...
## $ B02REC : int NA NA 2 5 6 NA NA NA NA NA ...
## $ B03LU : chr " " " " "8" "4" ...
## $ B03MA : chr " " " " "8" "4" ...
## $ B03MI : chr " " " " "8" "4" ...
## $ B03JU : chr " " " " "8" "4" ...
## $ B03VI : chr " " " " "8" "4" ...
## $ B03SA : chr " " " " "5" "4" ...
## $ B03DO : chr " " " " "0" "1" ...
## $ B04 : int NA NA 1 1 1 NA NA NA NA NA ...
## $ B05 : int NA NA NA NA NA NA NA NA NA NA ...
## $ B05A : int NA NA NA NA NA NA NA NA NA NA ...
## $ B06 : chr " " " " " " " " ...
## $ B07A : int NA NA 15 30 1 NA NA NA NA NA ...
## $ B07M : int NA NA 0 0 2 NA NA NA NA NA ...
## $ B07S : int NA NA 0 0 0 NA NA NA NA NA ...
## $ B08 : int NA NA 2 1 5 NA NA NA NA NA ...
## $ B09A : int NA NA 0 30 1 NA NA NA NA NA ...
## $ B09M : int NA NA 6 0 2 NA NA NA NA NA ...
## $ B09S : int NA NA 0 0 0 NA NA NA NA NA ...
## $ B10 : int NA NA 6 6 1 NA NA NA NA NA ...
## $ B11 : int NA NA NA NA 1 NA NA NA NA NA ...
## $ B12 : int NA NA 2 4 2 NA NA NA NA NA ...
## $ B12A : int NA NA 6 NA 6 NA NA NA NA NA ...
## $ B12B : int NA NA NA NA NA NA NA NA NA NA ...
## $ B12C : int NA NA NA NA NA NA NA NA NA NA ...
## $ B13 : int NA NA 88 NA 12 NA NA NA NA NA ...
## $ B14 : int NA NA 1 NA 1 NA NA NA NA NA ...
## $ B15 : int NA NA 4 NA 4 NA NA NA NA NA ...
## $ B16G : num NA NA 700000 NA 2350000 NA NA NA NA NA ...
## $ B16U : int NA NA 3 NA 5 NA NA NA NA NA ...
## $ B16D : int NA NA NA NA NA NA NA NA NA NA ...
## $ B16T : num NA NA 2800000 NA 2350000 NA NA NA NA NA ...
## $ B17 : int NA NA 6 NA 6 NA NA NA NA NA ...
## $ B18AG : num NA NA NA NA NA NA NA NA NA NA ...
## $ B18AU : int NA NA NA NA NA NA NA NA NA NA ...
## $ B18BG : num NA NA NA NA NA NA NA NA NA NA ...
## $ B18BU : int NA NA NA NA NA NA NA NA NA NA ...
## $ B19 : int NA NA 6 NA 6 NA NA NA NA NA ...
## $ B20G : num NA NA NA NA NA NA NA NA NA NA ...
## $ B20U : int NA NA NA NA NA NA NA NA NA NA ...
## $ B20D : int NA NA NA NA NA NA NA NA NA NA ...
## $ B20T : num NA NA NA NA NA NA NA NA NA NA ...
## $ B21 : int NA NA 6 NA 6 NA NA NA NA NA ...
## $ B22 : num NA NA NA NA NA NA NA NA NA NA ...
## $ B23 : num NA NA NA NA NA NA NA NA NA NA ...
## $ B24 : int NA NA 6 NA 6 NA NA NA NA NA ...
## $ B25 : num NA NA NA NA NA NA NA NA NA NA ...
## $ B26 : int NA NA 4 NA 1 NA NA NA NA NA ...
## [list output truncated]
names(eph2021)
## [1] "UPM" "NVIVI" "NHOGA"
## [4] "DPTOREP" "AREA" "L02"
## [7] "P02" "P03" "P04"
## [10] "P04A" "P04B" "P05C"
## [13] "P05P" "P05M" "P06"
## [16] "P08D" "P08M" "P08A"
## [19] "P09" "P10A" "P10AB"
## [22] "P10Z" "P11A" "P11AB"
## [25] "P11Z" "P12" "A01"
## [28] "A01A" "A02" "A03"
## [31] "A04" "A04B" "A04A"
## [34] "A05" "A07" "A08"
## [37] "A10" "A11A" "A11M"
## [40] "A11S" "A12" "A13REC"
## [43] "A14REC" "A15" "A16"
## [46] "A17A" "A17M" "A17S"
## [49] "A18" "A18A" "B01REC"
## [52] "B02REC" "B03LU" "B03MA"
## [55] "B03MI" "B03JU" "B03VI"
## [58] "B03SA" "B03DO" "B04"
## [61] "B05" "B05A" "B06"
## [64] "B07A" "B07M" "B07S"
## [67] "B08" "B09A" "B09M"
## [70] "B09S" "B10" "B11"
## [73] "B12" "B12A" "B12B"
## [76] "B12C" "B13" "B14"
## [79] "B15" "B16G" "B16U"
## [82] "B16D" "B16T" "B17"
## [85] "B18AG" "B18AU" "B18BG"
## [88] "B18BU" "B19" "B20G"
## [91] "B20U" "B20D" "B20T"
## [94] "B21" "B22" "B23"
## [97] "B24" "B25" "B26"
## [100] "B271" "B272" "B28"
## [103] "B29" "B30" "B31"
## [106] "C01REC" "C02REC" "C03"
## [109] "C04" "C05" "C06"
## [112] "C07" "C08" "C09"
## [115] "C101" "C102" "C11G"
## [118] "C11U" "C11D" "C11T"
## [121] "C12" "C13AG" "C13AU"
## [124] "C13BG" "C13BU" "C14"
## [127] "C14A" "C14B" "C14C"
## [130] "C15" "C16REC" "C17REC"
## [133] "C18" "C18A" "C18B"
## [136] "C19" "D01" "D02"
## [139] "D03" "D04" "D05"
## [142] "E01A" "E01B" "E01C"
## [145] "E01D" "E01E" "E01F"
## [148] "E01G" "E01H" "E01I"
## [151] "E01J" "E01K" "E01L"
## [154] "E01M" "E02D1" "E02D2"
## [157] "E02B" "ED01" "ED02"
## [160] "ED03" "ED0504" "ED06C"
## [163] "ED08" "ED09" "ED10"
## [166] "ED11F1" "ED11F1A" "ED11GH1"
## [169] "ED11GH1A" "ED12" "ED13"
## [172] "ED14" "ED14A" "ED15"
## [175] "S01A" "S01B" "S02"
## [178] "S03" "S03A" "S03B"
## [181] "S03C" "S04" "S05"
## [184] "S06" "S07" "S08"
## [187] "S09" "CATE_PEA" "TAMA_PEA"
## [190] "OCUP_PEA" "RAMA_PEA" "HORAB"
## [193] "HORABC" "HORABCO" "PEAD"
## [196] "PEAA" "TIPOHOGA" "FEX"
## [199] "NJEF" "NCON" "NPAD"
## [202] "NMAD" "TIC01" "TIC02"
## [205] "TIC03" "TIC0401" "TIC0402"
## [208] "TIC0403" "TIC0404" "TIC0405"
## [211] "TIC0406" "TIC0407" "TIC0408"
## [214] "TIC0409" "TIC0501" "TIC0502"
## [217] "TIC0503" "TIC0504" "TIC0505"
## [220] "TIC0506" "TIC0507" "TIC0508"
## [223] "TIC0509" "TIC0510" "TIC0511"
## [226] "TIC0512" "TIC0513" "TIC06"
## [229] "TIC07" "añoest" "ra06ya09"
## [232] "e01aimde" "e01bimde" "e01cimde"
## [235] "e01dde" "e01ede" "e01fde"
## [238] "e01gde" "e01hde" "e01ide"
## [241] "e01jde" "e01kde" "e01lde"
## [244] "e01mde" "e01kjde" "e02bde"
## [247] "ingrevasode" "ingrepytyvõde" "ingresect_privadode"
## [250] "ipcm" "pobrezai" "pobnopoi"
## [253] "quintili" "decili" "quintiai"
## [256] "decilai" "informalidad"