Vuelva a guardar este Rmd con su nombre, apellido y código. Corra estos códigos para limpiar la base de datos y poder hacer los ejercicios sin problema:

#Abrimos la base:
library(rio)
original_data = import("Base de datos CAF 2013.dta")
#Filtro:
data = original_data[,c("k6a","k7","m2","edade","f1")]

#Eliminando casos perdidos:
data = data[data$k6a != 97,]
data = data[data$k6a != 99,]
data = data[data$k7 != 97,]
data = data[data$k7 != 99,]
data = data[data$f1 != 97,] 
data = data[data$m2 != 98,]
data = data[data$m2 != 99,]

#Dando formato:
data$k6a = factor(data$k6a, levels = c(1:2), labels = c("Se encuentra cubierto","No se encuentra cubierto"))
data$k7 = factor(data$k7, levels = c(1:3), labels = c("Utiliza","No utiliza","No tiene"))
data$f1 = factor(data$f1, levels = c(1:7), labels = c("Usted","Usted y su pareja","Usted y otro miembro de la familia","Su pareja","Otro miembro de la familia", "Otra persona", "Nadie"))
data$m2 = factor(data$m2, levels = c(1:2), labels = c("Ha pasado","No ha pasado"))
#Limpia!
str(data)
## 'data.frame':    824 obs. of  5 variables:
##  $ k6a  : Factor w/ 2 levels "Se encuentra cubierto",..: 2 1 1 1 1 2 1 1 2 2 ...
##  $ k7   : Factor w/ 3 levels "Utiliza","No utiliza",..: 2 3 2 3 3 2 2 2 2 2 ...
##  $ m2   : Factor w/ 2 levels "Ha pasado","No ha pasado": 1 1 1 1 1 2 1 1 2 1 ...
##  $ edade: num  40 32 22 39 45 30 49 36 20 55 ...
##  $ f1   : Factor w/ 7 levels "Usted","Usted y su pareja",..: 2 2 1 3 2 2 2 5 5 2 ...

Solucionario: #pregunta 1 variable k6a

class(data$k6a)
## [1] "factor"
table(data$k6a)
## 
##    Se encuentra cubierto No se encuentra cubierto 
##                      411                      413
prop.table(table(data$k6a))*100
## 
##    Se encuentra cubierto No se encuentra cubierto 
##                 49.87864                 50.12136
grafico1<-table(data$k6a)
pie(grafico1,main = "Su dinero se encuentra asegurado o cubierto?")

barplot(grafico1,main ="Su sinero se encuentra asegurado o cubierto?")

#interpretación: La variable "k6a" corresponde a una pregunta en la cual se busca saber si el encuestado que tiene su depositado en algún banco,caja o financiera, éste se encuentra asegurado o cubierto. Por lo que podemos ver en el grafico y en el porcentaje, poco más de el 50.2% de los encuestados respondió que su dinero depositado no se encuentran cubierto o asegurado. En cambio, el 49.8% respondió que su dinero en el banco sí se encuentra asegurado. Por lo que podemos intuir que más del 50% está propopenso a sufrir un fraude bancario, o si la entidad quiebra, su dinero desapareceria. 

#pregunta 1 variable k7

class(data$k7)
## [1] "factor"
table(data$k7)
## 
##    Utiliza No utiliza   No tiene 
##         26        727         71
prop.table(table(data$k7))*100
## 
##    Utiliza No utiliza   No tiene 
##   3.155340  88.228155   8.616505
grafico2<-table(data$k7)
barplot(grafico2,main = "Utiliza su telefono para realizar pagos?")

pie(grafico2,main = "Utiliza su telefono para realizar pagos?")

#interpretación: Si en la pregunta de la variable K6 el encuestado respondió que su dinero no se encuentra cubierto, no sabe o simplemente no respondió, tiene que pasar a la pregunta de la variable k7. En esta pregunta se busca saber si el encuestado ulitiliza su telefono para realizar pagos. Por lo que podemos ver que el 88.2% no utiliza su telefono para realizar pagos; en cambio, solo el 3.1%  utiliza su telefono para realizar pagos, que contrasta con el 8.7& que respondió que no tiene telefono. Por lo que podemos intuir que para el 2013 en el Perú el uso de banca movil, que en la actualidad es una forma más simple, rápida y segura para realizar pagos, era aún muy baja. 

#pregunta 1, variable m2

class(data$m2)
## [1] "factor"
table(data$m2)
## 
##    Ha pasado No ha pasado 
##          537          287
prop.table(table(data$m2))*100
## 
##    Ha pasado No ha pasado 
##      65.1699      34.8301
grafico3<-table(data$m2)
pie(grafico3,main = "Algunas veces sus ingresos no le alcanzaron para cubrir sus gastos")

barplot(grafico3,main = "Algunas veces sus ingresos no le alcanzaron para cubrir sus gastos")

#La variable M2 corresponde a la pregunta en la cual se busca saber si, en los últimos 12 meses, al encuestado sus ingresos no le alcanzaron para cubrir sus gastos. Por lo que podemos ver que alrededor del 65% aproximadamente respondió que sí le ha pasado; en cambio, alrededor del 35% respondió que no. Por lo que podemos intuir que para en el 2013 los ingresos de la mayoría las personas,al menos una vez al año, no les alcanzaban para cubrir sus gastos. 

#pregunta 2, variable edade

class(data$edade)
## [1] "numeric"
summary(data$edade)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   18.00   26.00   36.00   37.85   46.00   84.00
quantile(data$edade)
##   0%  25%  50%  75% 100% 
##   18   26   36   46   84
boxplot(table(data$edade))

library(moments)
skewness(data$edade) #asimetria 
## [1] 0.6628117
kurtosis(data$edade) #curtosis
## [1] 2.74823
#En la pregunta dos y variable edad, podemos ver que la edad entre de los encuestados el mínimo fue 18 años, el mayor 84 años, la media de las edades fue 37.85, la mediana 36 años. Sin embargo, en el boxplot no se marca toda la muestra, pero eso no limita la interpretación del summary. Por lo que podemos ver, según la asimetria negativa y al curtosis leptocúrtica, que la muestra del estudio se baso, más que nada, en población adulta alrededor de los 36 años. 

#pregunta 3, variable f1

class(data$f1)
## [1] "factor"
table(data$f1)
## 
##                              Usted                  Usted y su pareja 
##                                316                                231 
## Usted y otro miembro de la familia                          Su pareja 
##                                 43                                 66 
##         Otro miembro de la familia                       Otra persona 
##                                167                                  0 
##                              Nadie 
##                                  1
prop.table(table(data$f1))*100
## 
##                              Usted                  Usted y su pareja 
##                         38.3495146                         28.0339806 
## Usted y otro miembro de la familia                          Su pareja 
##                          5.2184466                          8.0097087 
##         Otro miembro de la familia                       Otra persona 
##                         20.2669903                          0.0000000 
##                              Nadie 
##                          0.1213592
grafico4<-table(data$f1)
pie(grafico4, main = "Quién se encarga del manejo del dinero")

#En la pregunta 3 y variable f1, se quiere buscar quién es el responsable de tomas las decisiones con el manejo diario del dinero en el hogar. Según las respuestas, podemos ver que las respuestas más comunes fueron que la misma persona o la persona y su pareja toman las decisiones del manejo del dinero en el hogar; en ambas, los porcentajes fueron aproximadamente 38% y 28% respectivamente. El tercer dato más común fue que otro miembro de la famila, alrededor del 20%, se encarga del manejo del dinero en el hogar. En cambio, las respuestas menos usuales fueron que la pareja del encuestado o el encuestado y algún otro miembro de su familia se encargan del manejo del dinero en el hogas; alrededor de 8% y 5% respectivamente. Y,por último, solo uno de los encuestados respondió que nadie se encarga del manejo del dinero y ninguno respondió que otro persona.