Para realizar la práctica
# Guardamos el enlace de descarga de la Base de Datos de la Encuesta Permanente de Hogares (EPH)2019.
url.eph.2019 = "https://www.ine.gov.py/datos/encuestas/eph/Poblacion/EPH-2019/data/4edb7reg02_ephc2019.csv"
# Guardamos los datos de la Encuesta Permanente de Hogares (EPH)2019 en el objeto data.eph.2019
data.eph.2019 = read.csv(url.eph.2019,sep = ";",header = T)
Ahora seleccionamos las variables con las que trabajaremos de la EPH 2019.
# Visualizamos los nombres de las variables en data.eph.2019
names(data.eph.2019)
## [1] "ï..UPM" "NVIVI" "NHOGA" "DPTOREP" "AREA" "L02"
## [7] "P02" "P03" "P04" "P04A" "P04B" "P05C"
## [13] "P05P" "P05M" "P06" "P08D" "P08M" "P08A"
## [19] "P09" "P10A" "P10AB" "P10Z" "P11A" "P11AB"
## [25] "P11Z" "P12" "A01" "A01A" "A02" "A03"
## [31] "A04" "A04A" "A05" "A07" "A08" "A10"
## [37] "A11A" "A11M" "A11S" "A12" "A13REC" "A14REC"
## [43] "A15" "A16" "A17A" "A17M" "A17S" "A18"
## [49] "B01REC" "B02REC" "B03LU" "B03MA" "B03MI" "B03JU"
## [55] "B03VI" "B03SA" "B03DO" "B04" "B05" "B06"
## [61] "B07A" "B07M" "B07S" "B08" "B09A" "B09M"
## [67] "B09S" "B10" "B11" "B12" "B12A" "B12B"
## [73] "B12C" "B13" "B14" "B15" "B16G" "B16U"
## [79] "B16D" "B16T" "B17" "B18AG" "B18AU" "B18BG"
## [85] "B18BU" "B19" "B20G" "B20U" "B20D" "B20T"
## [91] "B21" "B22" "B23" "B24" "B25" "B26"
## [97] "B271" "B272" "B28" "B29" "B30" "B31"
## [103] "C01REC" "C02REC" "C03" "C04" "C05" "C06"
## [109] "C07" "C08" "C09" "C101" "C102" "C11G"
## [115] "C11U" "C11D" "C11T" "C12" "C13AG" "C13AU"
## [121] "C13BG" "C13BU" "C14" "C14A" "C14B" "C14C"
## [127] "C15" "C16REC" "C17REC" "C18" "C18A" "C18B"
## [133] "C19" "D01" "D02" "D03" "D04" "D05"
## [139] "E01A" "E01B" "E01C" "E01D" "E01E" "E01F"
## [145] "E01G" "E01H" "E01I" "E01J" "E01K" "E01L"
## [151] "E01M" "ED01" "ED02" "ED03" "ED0504" "ED06C"
## [157] "ED08" "ED09" "ED10" "ED11B1" "ED11B2" "ED11B3"
## [163] "ED11B4" "ED11B5" "ED11B6" "ED11B7" "ED11B8" "ED11B9"
## [169] "ED11C1" "ED11D1" "ED11E1" "ED11F1" "ED11F1A" "ED11F1B"
## [175] "ED11G1" "ED11G1A" "ED11G1B" "ED11H1" "ED11H1A" "ED11H1B"
## [181] "ED12" "ED13" "ED14" "ED14A" "ED15" "S01A"
## [187] "S01B" "S02" "S03" "S04" "S05" "S06"
## [193] "S07" "S08" "S09" "CATE_PEA" "TAMA_PEA" "OCUP_PEA"
## [199] "RAMA_PEA" "HORAB" "HORABC" "HORABCO" "PEAD" "PEAA"
## [205] "TIPOHOGA" "FEX" "NJEF" "NCON" "NPAD" "NMAD"
## [211] "TIC01" "TIC02" "TIC03" "TIC0401" "TIC0402" "TIC0403"
## [217] "TIC0404" "TIC0405" "TIC0406" "TIC0407" "TIC0408" "TIC0409"
## [223] "TIC0501" "TIC0502" "TIC0503" "TIC0504" "TIC0505" "TIC0506"
## [229] "TIC0507" "TIC0508" "TIC0509" "TIC0510" "TIC0511" "TIC0512"
## [235] "TIC0513" "TIC06" "aÃ.oest" "ra06ya09" "e01aimde" "e01bimde"
## [241] "e01cimde" "e01dde" "e01ede" "e01fde" "e01gde" "e01hde"
## [247] "e01ide" "e01jde" "e01kde" "e01lde" "e01mde" "e01kjde"
## [253] "e02bde" "ipcm" "pobrezai" "pobnopoi" "quintili" "decili"
## [259] "quintiai" "decilai"
Seleccionamos las variables y etiquetamos según corresponda
data.eph.2019.fil <- subset(data.eph.2019, TIC0509!=9 & TIC0509!="NA"& P02>=18,select =c(P06,TIC0509,P02))
#Etiquetamos la variable Sexo
data.eph.2019.fil$Sexo <- factor(data.eph.2019.fil$P06, labels = c("Hombres","Mujeres"))
#Etiquetamos la variable,En los últimos 3 meses, utilizó Internet para transacción bancaria
data.eph.2019.fil$Tbancaria <- factor(data.eph.2019.fil$TIC0509, labels = c("Si","No"))
#summary
summary(data.eph.2019.fil)
## P06 TIC0509 P02 Sexo Tbancaria
## Min. :1.000 Min. :1.000 Min. :18.00 Hombres:3898 Si: 589
## 1st Qu.:1.000 1st Qu.:6.000 1st Qu.:25.00 Mujeres:4139 No:7448
## Median :6.000 Median :6.000 Median :34.00
## Mean :3.575 Mean :5.634 Mean :35.96
## 3rd Qu.:6.000 3rd Qu.:6.000 3rd Qu.:45.00
## Max. :6.000 Max. :6.000 Max. :88.00
Estadísticas Descriptivas
# Tabla de frecuencia absoluta
tabla.sexo.tbancaria<- xtabs(~Sexo+Tbancaria,data = data.eph.2019.fil)
tabla.sexo.tbancaria
## Tbancaria
## Sexo Si No
## Hombres 318 3580
## Mujeres 271 3868
# Tabla de frecuencia relativa (proporciones)
tabla.sexo.tbancaria_prop <- prop.table(tabla.sexo.tbancaria,margin = 1)
addmargins(tabla.sexo.tbancaria_prop,margin = 2)
## Tbancaria
## Sexo Si No Sum
## Hombres 0.08158030 0.91841970 1.00000000
## Mujeres 0.06547475 0.93452525 1.00000000
# Grafico de barras para frecuencia absoluta
barplot(t(tabla.sexo.tbancaria), beside = T, legend.text = T)
# Grafico de barras para frecuencia relativa (proporciones)
barplot(t(prop.table(tabla.sexo.tbancaria,margin = 1)), beside = T, legend.text = T)
\(H_0:\) La proporción de hombres que en los últimos 3 meses, utilizó Internet para transacción bancaria no es mayor que la de mujeres.
\(H_1:\) La proporción de hombres que en los últimos 3 meses, utilizó Internet para transacción bancaria es mayor que la de mujeres.
Utilizaremos la Distribución muestral de Diferencia de Proporciones para contrastar las hipótesis.
Criterios de decisión
Para un \(\alpha=0,05\), si \(z\le 1,645\) no se rechaza la \(H_0\).
Para un \(\alpha=0,05\), si \(z > 1,645\) se rechaza la \(H_0\).
Debemos calcular el estadístico de prueba
En primer lugar tomamos z.
x_H <- tabla.sexo.tbancaria[1,1]
x_H
## [1] 318
x_M <- tabla.sexo.tbancaria[2,1]
x_M
## [1] 271
n_H <- sum(tabla.sexo.tbancaria[1,])
n_H
## [1] 3898
n_M <- sum(tabla.sexo.tbancaria[2,])
n_M
## [1] 4139
pest_H = tabla.sexo.tbancaria_prop[1,1]
pest_H
## [1] 0.0815803
pest_M = tabla.sexo.tbancaria_prop[2,1]
pest_M
## [1] 0.06547475
pest_gral <- (x_H+x_M)/(n_H+n_M)
pest_gral
## [1] 0.07328605
Calculamos el valor de z
z <- (pest_H-pest_M)/sqrt(pest_gral*(1-pest_gral)*(1/n_H+1/n_M))
z
## [1] 2.76894
Conclusión: Observamos que el valor de \(z=2,76894>1,645\). Por tanto, se rechaza la \(H_0\), esto significa que existe evidencia estadistica para afirmar con un nivel de significancia del 0,05, que la proporción de hombres que en los últimos 3 meses, utilizó Internet para transacción bancaria es mayor que la de mujeres en el año 2019.
Criterios de decisión
Para un \(\alpha=0,05\), si \(p_{valor} > 0,05\) no se rechaza la \(H_0\).
Para un \(\alpha=0,05\), si \(p_{valor} \le 0,05\) se rechaza la \(H_0\).
# Prueba unilateral derecha
prop.test(tabla.sexo.tbancaria, alternative = "greater")
##
## 2-sample test for equality of proportions with continuity correction
##
## data: tabla.sexo.tbancaria
## X-squared = 7.4317, df = 1, p-value = 0.003204
## alternative hypothesis: greater
## 95 percent confidence interval:
## 0.006264758 1.000000000
## sample estimates:
## prop 1 prop 2
## 0.08158030 0.06547475
Conclusión: Como la prueba estadística basada en la diferencia entre proporciones arroja un p valor casi nulo, entonces rechazamos la hipoesis nula. Afirmar que con un nivel de significancia del 0,05, la proporción de hombres que en los últimos 3 meses, utilizó Internet para transacción bancaria es mayor que la de mujeres, en el año 2019.
# Guardar el enlace de la Base de Datos de la Encuesta Permanente de Hogares (EPH)2020.
url.eph.2020 = "https://www.ine.gov.py/datos/encuestas/eph/Poblacion/EPH-2020/data/55f07reg02_ephc2020.csv"
# Guardar los datos de la Encuesta Permanente de Hogares (EPH)2020 en el objeto data.eph.2020
data.eph.2020 = read.csv(url.eph.2020,sep = ";",header = T)
# Visualizamos los nombres de las variables en data.eph.2020
names(data.eph.2020)
## [1] "ï..UPM" "NVIVI"
## [3] "NHOGA" "DPTOREP"
## [5] "AREA" "L02"
## [7] "P02" "P03"
## [9] "P04" "P04A"
## [11] "P04B" "P05C"
## [13] "P05P" "P05M"
## [15] "P06" "P08D"
## [17] "P08M" "P08A"
## [19] "P09" "P10A"
## [21] "P10AB" "P10Z"
## [23] "P11A" "P11AB"
## [25] "P11Z" "P12"
## [27] "A01" "A01A"
## [29] "A02" "A03"
## [31] "A04" "A04B"
## [33] "A04A" "A05"
## [35] "A07" "A08"
## [37] "A10" "A11A"
## [39] "A11M" "A11S"
## [41] "A12" "A13REC"
## [43] "A14REC" "A15"
## [45] "A16" "A17A"
## [47] "A17M" "A17S"
## [49] "A18" "A18A"
## [51] "B01REC" "B02REC"
## [53] "B03LU" "B03MA"
## [55] "B03MI" "B03JU"
## [57] "B03VI" "B03SA"
## [59] "B03DO" "B04"
## [61] "B05" "B05A"
## [63] "B06" "B07A"
## [65] "B07M" "B07S"
## [67] "B08" "B09A"
## [69] "B09M" "B09S"
## [71] "B10" "B11"
## [73] "B12" "B12A"
## [75] "B12B" "B12C"
## [77] "B13" "B14"
## [79] "B15" "B16G"
## [81] "B16U" "B16D"
## [83] "B16T" "B17"
## [85] "B18AG" "B18AU"
## [87] "B18BG" "B18BU"
## [89] "B19" "B20G"
## [91] "B20U" "B20D"
## [93] "B20T" "B21"
## [95] "B22" "B23"
## [97] "B24" "B25"
## [99] "B26" "B271"
## [101] "B272" "B28"
## [103] "B29" "B30"
## [105] "B31" "C01REC"
## [107] "C02REC" "C03"
## [109] "C04" "C05"
## [111] "C06" "C07"
## [113] "C08" "C09"
## [115] "C101" "C102"
## [117] "C11G" "C11U"
## [119] "C11D" "C11T"
## [121] "C12" "C13AG"
## [123] "C13AU" "C13BG"
## [125] "C13BU" "C14"
## [127] "C14A" "C14B"
## [129] "C14C" "C15"
## [131] "C16REC" "C17REC"
## [133] "C18" "C18A"
## [135] "C18B" "C19"
## [137] "D01" "D02"
## [139] "D03" "D04"
## [141] "D05" "E01A"
## [143] "E01B" "E01C"
## [145] "E01D" "E01E"
## [147] "E01F" "E01G"
## [149] "E01H" "E01I"
## [151] "E01J" "E01K"
## [153] "E01L" "E01M"
## [155] "E02C1" "E02D1"
## [157] "E02D2" "E02B"
## [159] "E02G1" "E02G2"
## [161] "E02F" "ED01"
## [163] "ED02" "ED03"
## [165] "ED0504" "ED06C"
## [167] "ED08" "ED09"
## [169] "ED10" "ED11F1"
## [171] "ED11F1A" "ED11GH1"
## [173] "ED11GH1A" "ED12"
## [175] "ED13" "ED14"
## [177] "ED14A" "ED15"
## [179] "S01A" "S01B"
## [181] "S02" "S03"
## [183] "S03A" "S03B"
## [185] "S03C" "S04"
## [187] "S05" "S06"
## [189] "S07" "S08"
## [191] "S09" "CATE_PEA"
## [193] "TAMA_PEA" "OCUP_PEA"
## [195] "RAMA_PEA" "HORAB"
## [197] "HORABC" "HORABCO"
## [199] "PEAD" "PEAA"
## [201] "informalidad" "TIPOHOGA"
## [203] "FEX" "NJEF"
## [205] "NCON" "NPAD"
## [207] "NMAD" "TIC01"
## [209] "TIC02" "TIC03"
## [211] "TIC0401" "TIC0402"
## [213] "TIC0403" "TIC0404"
## [215] "TIC0405" "TIC0406"
## [217] "TIC0407" "TIC0408"
## [219] "TIC0409" "TIC0501"
## [221] "TIC0502" "TIC0503"
## [223] "TIC0504" "TIC0505"
## [225] "TIC0506" "TIC0507"
## [227] "TIC0508" "TIC0509"
## [229] "TIC0510" "TIC0511"
## [231] "TIC0512" "TIC0513"
## [233] "TIC06" "TIC07"
## [235] "aÃ.oest" "ra06ya09"
## [237] "e01aimde" "e01bimde"
## [239] "e01cimde" "e01dde"
## [241] "e01ede" "e01fde"
## [243] "e01gde" "e01hde"
## [245] "e01ide" "e01jde"
## [247] "e01kde" "e01lde"
## [249] "e01mde" "e01kjde"
## [251] "e02bde" "ingrevasode"
## [253] "ingreÃ.angarekode" "ingrepytyvõde"
## [255] "ingresect_privadode" "ingreadicional_tekoporÃ.de"
## [257] "otroingre_subside" "ipcm"
## [259] "pobrezai" "pobnopoi"
## [261] "quintili" "decili"
## [263] "quintiai" "decilai"
Seleccionar las variables y etiquetar según corresponda
data.eph.2020.fil <- subset(data.eph.2020, TIC0509!=9 & TIC0509!="NA"& P02>=18,select =c(P06,TIC0509,P02))
#summary(data.eph.2020.fil)
#Etiquetamos la variable Sexo
data.eph.2020.fil$Sexo <- factor(data.eph.2020.fil$P06, labels = c("Hombres","Mujeres"))
#Etiquetamos la variable,En los últimos 3 meses, utilizó Internet para transacción bancaria
data.eph.2020.fil$Tbancaria <- factor(data.eph.2020.fil$TIC0509, labels = c("Si","No"))
summary(data.eph.2020.fil)
## P06 TIC0509 P02 Sexo Tbancaria
## Min. :1.000 Min. :1.000 Min. :18.00 Hombres:3950 Si: 686
## 1st Qu.:1.000 1st Qu.:6.000 1st Qu.:25.00 Mujeres:4238 No:7502
## Median :6.000 Median :6.000 Median :35.00
## Mean :3.588 Mean :5.581 Mean :36.85
## 3rd Qu.:6.000 3rd Qu.:6.000 3rd Qu.:46.00
## Max. :6.000 Max. :6.000 Max. :89.00
Estadísticas Descriptivas
# Tabla de frecuencia absoluta
tabla.sexo.tbancaria<- xtabs(~Sexo+Tbancaria,data = data.eph.2020.fil)
tabla.sexo.tbancaria
## Tbancaria
## Sexo Si No
## Hombres 377 3573
## Mujeres 309 3929
# Tabla de frecuencia relativa (proporciones)
tabla.sexo.tbancaria_prop <- prop.table(tabla.sexo.tbancaria,margin = 1)
addmargins(tabla.sexo.tbancaria_prop,margin = 2)
## Tbancaria
## Sexo Si No Sum
## Hombres 0.09544304 0.90455696 1.00000000
## Mujeres 0.07291175 0.92708825 1.00000000
# Grafico de barras para frecuencia absoluta
barplot(t(tabla.sexo.tbancaria), beside = T, legend.text = T)
# Grafico de barras para frecuencia relativa (proporciones)
barplot(t(prop.table(tabla.sexo.tbancaria,margin = 1)), beside = T, legend.text = T)
\(H_0:\) La proporción de hombres que en los últimos 3 meses, utilizó Internet para transacción bancaria no es mayor que la de mujeres.
\(H_1:\) La proporción de hombres que en los últimos 3 meses, utilizó Internet para transacción bancaria es mayor que la de mujeres.
Utilizaremos la distribución muestral de diferencia de proporciones para contrastar las hipótesis.
Criterios de decisión
Para un \(\alpha=0,05\), si \(z\le 1,645\) no se rechaza la \(H_0\).
Para un \(\alpha=0,05\), si \(z > 1,645\) se rechaza la \(H_0\).
Debemos calcular el estadístico de prueba
En primer lugar tomamos z.
x_H <- tabla.sexo.tbancaria[1,1]
x_H
## [1] 377
x_M <- tabla.sexo.tbancaria[2,1]
x_M
## [1] 309
n_H <- sum(tabla.sexo.tbancaria[1,])
n_H
## [1] 3950
n_M <- sum(tabla.sexo.tbancaria[2,])
n_M
## [1] 4238
pest_H = tabla.sexo.tbancaria_prop[1,1]
pest_H
## [1] 0.09544304
pest_M = tabla.sexo.tbancaria_prop[2,1]
pest_M
## [1] 0.07291175
pest_gral <- (x_H+x_M)/(n_H+n_M)
pest_gral
## [1] 0.08378114
Calculamos el valor de z
z <- (pest_H-pest_M)/sqrt(pest_gral*(1-pest_gral)*(1/n_H+1/n_M))
z
## [1] 3.677082
Conclusión: Como el valor de \(z=3,677085>1,645\). Por tanto, se rechaza la \(H_0\), esto significa que existe evidencia estadistica para afirmar que con un nivel de significancia del 0,05, la proporción de hombres que en los últimos 3 meses, utilizó Internet para transacción bancaria es mayor que la de mujeres en el año 2020.
Criterios de decisión
Para un \(\alpha=0,05\), si \(p_{valor} > 0,05\) no se rechaza la \(H_0\).
Para un \(\alpha=0,05\), si \(p_{valor} \le 0,05\) se rechaza la \(H_0\).
Para encontrar el
# Prueba unilateral derecha
prop.test(tabla.sexo.tbancaria, alternative = "greater")
##
## 2-sample test for equality of proportions with continuity correction
##
## data: tabla.sexo.tbancaria
## X-squared = 13.229, df = 1, p-value = 0.0001378
## alternative hypothesis: greater
## 95 percent confidence interval:
## 0.01217301 1.00000000
## sample estimates:
## prop 1 prop 2
## 0.09544304 0.07291175
Conclusión: Como la prueba estadística basada en la diferencia entre proporciones arroja un p valor casi nulo, entonces rechazamos la hipoesis nula. Afirmar que con un nivel de significancia del 0,05, la proporción de hombres que en los últimos 3 meses, utilizó Internet para transacción bancaria es mayor que la de mujeres, en el año 2020.