El instrumento utilizado para realizar el trabajo es la base de datos de la Encuesta Nacional de Victimización 2017 que realizó el INDEC. La población objetivo de esta encuesta abarcó a las personas de 18 años o más residentes en viviendas particulares de las localidades de 5.000 y más habitantes de la República Argentina. Se tuvo como objetivo dar estimaciones de los indicadores más importantes para el dominio nacional y para las 24 divisiones políticas, compuestas por las 23 provincias y la Ciudad Autónoma de Buenos Aires.
#Análisis
library(readxl) basevictimizacion <- read_excel(“basevictimizacion.xlsx”) View(basevictimizacion)
#Quiero conocer la cantidad de filas y columnas que tiene la base con la que voy a trabajar:
dim(basevictimizacion) [1] 29303 750
#Renombro las variables de la base que voy a utilizar con el comando names. Entre corchetes le indico la ubicación de la variable en la base:
names(basevictimizacion)[1]=“nombredeprovincia” names(basevictimizacion)[24]=“ingresototalmensual” names(basevictimizacion)[26]=“tramoingresotm” names(basevictimizacion)[56]=“edad” names(basevictimizacion)[77]=“inseguridadproblema” names(basevictimizacion)[78]=“comosesiente” names(basevictimizacion)[97]=“delincuenciavariacion” names(basevictimizacion)[184]=“delitohogarantes16” names(basevictimizacion)[185]=“delitohogar17” names(basevictimizacion)[204]=“delitopersonaantes16” names(basevictimizacion)[205]=“delitopersona17”
#Quiero conocer las características de las variables numéricas y lo hago a través del comando summary que me dice la estructura y contenido de la variable que quiero conocer: Me brinda información sobre los valores mínimo y máximo, la media, la mediana y los cuartiles de la variable Ingreso total mensual del hogar(hih01):
summary(basevictimizacion$ingresototalmensual) Min. 1st Qu. Median Mean 3rd Qu. Max. NA’s 500 8000 13000 16831 20000 200000 12496
#Aquí quiero conocer los valores mínimo y máximo, la media, la mediana y los cuartiles de la variable Edad de la persona del hogar elegida para contestar la encuesta (hch04):
summary(basevictimizacion$edad) Min. 1st Qu. Median Mean 3rd Qu. Max. 18.00 31.00 44.00 46.15 60.00 100.00
#Uso otros comandos para conocer el mínimo y el máximo de los valores de una variable. En este caso de la variable edad:
max(basevictimizacion$edad) [1] 100
min(basevictimizacion$edad) [1] 18
#Quiero recodificar la variable nombredeprovincia, lo hago con el comando factor:
basevictimizacion\(nombredeprovincia <- factor(x=basevictimizacion\)nombredeprovincia, levels = c(“01”, “02”, “03”,“04”,“05”,“06”,“07”,“08”,“09”,“10”,“11”,“12”,“13”,“14”,“15”,“16”,“17”,“18”,“19”,“20”,“21”,“22”,“23”,“24”), labels = c(“Ciudad de Buenos Aires”, “Buenos Aires”, “Catamarca”,“Córdoba”,“Corrientes”,“Chaco”,“Chubut”,“Entre Ríos”,“Formosa”,“Jujuy”,“La Pampa”,“La Rioja”,“Mendoza”,“Misiones”,“Neuquén”,“Río Negro”,“Salta”,“San Juan”,“San Luis”,“Santa Cruz”,“Santa Fé”,“Santiago del Estero”,“Tucumán”,“Tierra del Fuego”))
#Uso el comando levels para verificar que asignó los nombres a los niveles numéricos:
levels(basevictimizacion$nombredeprovincia) [1] “Ciudad de Buenos Aires” “Buenos Aires” “Catamarca”
[4] “Córdoba” “Corrientes” “Chaco”
[7] “Chubut” “Entre Ríos” “Formosa”
[10] “Jujuy” “La Pampa” “La Rioja”
[13] “Mendoza” “Misiones” “Neuquén”
[16] “Río Negro” “Salta” “San Juan”
[19] “San Luis” “Santa Cruz” “Santa Fé”
[22] “Santiago del Estero” “Tucumán” “Tierra del Fuego”
#Quiero recodificar la variable inseguridadproblema, lo hago con el comando factor:
basevictimizacion\(inseguridadproblema <- factor(x=basevictimizacion\)inseguridadproblema, + levels = c(“01”, “02”, “03”,“04”,“05”), + labels = c(“Muy grave”,“Bastante grave”,“Poco grave”,“Nada grave”,“No sabe-No contesta”))
#Uso el comando levels para verificar que asignó los nombres a los niveles numéricos:
levels(basevictimizacion$inseguridadproblema) [1] “Muy grave” “Bastante grave” “Poco grave”
[4] “Nada grave” “No sabe-No contesta”
#Quiero recodificar la variable delicuenciavariacion, lo hago con el comando factor:
basevictimizacion\(delincuenciavariacion <- factor(x=basevictimizacion\)delincuenciavariacion, + levels = c(“01”, “02”, “03”,“04”), + labels = c(“Aumentó”,“Se mantiene igual”,“Disminuyó”,“No sabe-No contesta”))
#Uso el comando levels para verificar que asignó los nombres a los niveles numéricos:
levels(basevictimizacion$delincuenciavariacion) [1] “Aumentó” “Se mantiene igual” “Disminuyó”
[4] “No sabe-No contesta”
1-¿Considera que hoy en esta ciudad la inseguridad respecto al delito es un problema…
tabla1=table(basevictimizacion$inseguridadproblema) tabla1
Muy grave Bastante grave Poco grave Nada grave
10856 12601 5141 523
No sabe-No contesta 182
#Hago un gráfico de la variable inseguridadproblema para conocer la distribución de las categorías con el comando barplot:
barplot(tabla1)
Gráfico en archivo adjunto