Tema: Violencia Intrafamiliar contra la mujer en la Región Metropolitana.

Profesora: Magdalena Cortina

Ayudante: Catalina Hidalgo

Data Science para Economía y Negocios Sec. 1 STGO

Contexto

A finales del 2019 se protagonizaron movilizaciones sociales que visibilizan situaciones que acomplejan a la sociedad chilena, una de estas fue el “Día internacional contra la Violencia hacia las mujeres” donde miles de mujeres protestaron contra la violencia y los femicidios que ocurren en Chile y el mundo, además de exigir sus derechos y, que los canales regulatorios sean justos y garanticen la seguridad de las personas. A partir de esta problemática, reconocemos que existe violencia contra las mujeres en distintos escenarios (calle, laboral, académico, etc). Es por eso que en este estudio queremos indagar con respecto al contexto que se da con la pareja, investigar la violencia intrafamiliar hacia la mujer, y segmentar por la Región Metropolitana, ya que es la región con más denuncias de Chile durante el año 2019, con un total de 33.829 denuncias, según el CEAD (Centro de estudios y Análisis del Delito). El Estado de Chile tiene 6 centros de atención, Red SernamEg, servicio telefónico y diversos programas de campañas para erradicar la violencia de género. Por otro lado, la sociedad es más consciente de la violencia intrafamiliar que sufren las mujeres, en donde varias fundaciones incentivan a que denuncien por el conducto regular, pero no todas las víctimas lo hacen. “En la mayoría de los casos, las víctimas tardan años en denunciar lo ocurrido, por lo tanto, el operador que la atienda debe preocuparse de procurar un ambiente de confianza para que esa persona se sienta segura de entregar toda la información, y no decida retractarse decepcionada por un sistema que no coincide con sus necesidades.” (Villegas. M, 2017). Es por esto, que creemos que uno de nuestros puntos de la investigación debe ser identificar a aquellas mujeres que calzan con un perfil que sufre VIF, identificarlas con el fin de poder ayudarlas y apoyar a las instituciones que intentan localizarlas. Algo que tenemos que tener en consideración, “De esto se deduce, que las características de cada país influyen en el alcance de la violencia en general y en la pareja en particular. Desde la macro-estructura influyen los niveles de globalización, el ámbito político, económico y los aspectos culturales. En el exosistema se incluyen las estructuras individuales formales e informales. En el nivel micro se sitúan los grupos o unidades de interacción que influyen en la actualización y transmisión de la violencia - los que hacen referencia al contexto de la relación, al nivel de satisfacción y a la armonía familiar. Por último, en el nivel ontogenético se integran las características individuales y referidas a la historia de abusos.” (Puente-Martínez, Alicia, Ubillos-Landa, Silvia, Echeburúa, Enrique, & Páez-Rovira, Darío. (2016))

Elección de la Pregunta

En base a la problemática anteriormente presentada, nos gustaría poder resolver las siguientes interrogantes ¿Cuáles son los entornos demográficos que pueden propiciar a que una mujer sufra de violencia intrafamiliar ? Y así, ¿Cuáles serían las características de las posibles víctimas o mujeres ya maltratadas, dentro de la Región Metropolitana?

Con el propósito de saber dónde, cómo, por qué y a qué perfil de mujeres sufre violencia intrafamiliar con más frecuencia, o incluso, lograr predecir qué mujer es más probable que sufra de violencia intrafamiliar mediante un perfilamiento.

Base de Datos

Para esta investigación, realizaremos nuestro análisis utilizando la base de datos desprendida por la “IV Encuesta de violencia contra la mujer en el ámbito violencia intrafamiliar y en otros espacios” (ENVIF-VCM) desarrollada en Chile el año 2020. La cual tiene como objetivo obtener información relevante sobre la magnitud y características de la violencia de género que afecta a mujeres de zonas urbanas a nivel nacional y regional. Esta encuesta consta de entrevistar a mujeres entre 15 a 65 años y adultas mayores (desde 66 años en adelante). Los datos recopilan la información de las encuestadas desde el 18 de diciembre del 2019 hasta el 08 de marzo de 2020. La muestra consta de 6775 casos de mujeres entre 15 a 65 años, y 960 casos de mujeres mayores de 66 años, teniendo además un factor poblacional para cada tipo. La encuesta contiene 156 preguntas, es decir, 156 variables (la mayoría categórica) que buscan ahondar tanto en el perfil demográfico de la encuestada como en su entorno y consecuencias del posible acto (Incluyendo posibles secuelas y razones para no realizar la denuncia).

La base de datos en sí es bastante completa a la hora de analizar un perfil demográfico sobre las mujeres, ya que la encuesta posee información sobre si han sido abusadas, sí lo fueron en la niñez o recientemente, el tipo de abuso, el sector donde vive, nivel de educación, su opinión sobre comportamientos machistas y cómo se relaciona la mujer encuestada con su círculo cercano y entorno, ya sea familiar, laboral o de pareja. Gracias a lo anterior se puede decir que al ahondar en las preguntas y en la relación entre las variables se puede conseguir un perfil demográfico y psicológico de las mujeres abusadas.

Cargar base de datos

Creación Variables Base de datos

Nos interesa segmentar la violencia en 3 principales tipos de violencias. En este caso nos enfocaremos en la violencia fisica, violencia psicologica y violencia sexual.

#Generamos variabble Violencia Fisica
santiago[p116_a_1==1 |p116_a_2==1 | p116_a_3==1 | p116_a_4==1 | p116_a_5==1 | p116_a_6==1 | p116_a_7==1 | p116_a_8==1 | p116_a_9==1 | p116_a_10==1, VIO_FIS:=1]
santiago[p116_a_1!=1 & p116_a_2!=1 & p116_a_3!=1 & p116_a_4!=1 & p116_a_5!=1 & p116_a_6!=1 & p116_a_7!=1 & p116_a_8!=1 & p116_a_9!=1 & p116_a_10!=1, VIO_FIS:=0]
santiago[, .N , by=VIO_FIS]
##    VIO_FIS    N
## 1:       1 1143
## 2:       0 6592
#Generamos variabble Violencia Psicologica
santiago[p102_a_1==1 |p102_a_2==1 | p102_a_3==1 | p102_a_4==1 | p102_a_5==1 | p102_a_6==1 | p102_a_7==1 | p102_a_8==1 | p102_a_9==1 | p102_a_10==1, VIO_PSI:=1]
santiago[p102_a_1!=1 &p102_a_2!=1 & p102_a_3!=1 & p102_a_4!=1 & p102_a_5!=1 & p102_a_6!=1 & p102_a_7!=1 & p102_a_8!=1 & p102_a_9!=1 & p102_a_10!=1, VIO_PSI:=0]
santiago[, .N , by=VIO_PSI]
##    VIO_PSI    N
## 1:       1 2772
## 2:       0 4963
#Generamos variabble Violencia Sexual
santiago[p132_a_1==1 |p132_a_2==1 | p132_a_3==1 | p132_a_4==1 | p132_a_5==1 | p132_a_6==1 | p132_a_7==1 | p132_a_8==1, VIO_SEX:=1]
santiago[p132_a_1!=1 & p132_a_2!=1 & p132_a_3!=1 & p132_a_4!=1 & p132_a_5!=1 & p132_a_6!=1 & p132_a_7!=1 & p132_a_8!=1, VIO_SEX:=0]
santiago[, .N , by=VIO_SEX]
##    VIO_SEX    N
## 1:       1  761
## 2:       0 6974

Ahora lo hacemos viendo si la sufrio en el año

#AHora generamos para cuando fueron este año
 
#Generamos variabble Violencia Fisica del año
santiago[p116_b_1==1 |p116_b_2==1 | p116_b_3==1 | p116_b_4==1 | p116_b_5==1 | p116_b_6==1 | p116_b_7==1 | p116_b_8==1 | p116_b_9==1 | p116_b_10==1, VIO_FIS_A:=1]
santiago[p116_b_1!=1 & p116_b_2!=1 & p116_b_3!=1 & p116_b_4!=1 & p116_b_5!=1 & p116_b_6!=1 & p116_b_7!=1 & p116_b_8!=1 & p116_b_9!=1 & p116_b_10!=1, VIO_FIS_A:=0]
santiago[, .N , by=VIO_FIS_A]
##    VIO_FIS_A    N
## 1:         0 7495
## 2:         1  240
#Generamos variabble Violencia Psicologica del año
santiago[p102_b_1==1 |p102_b_2==1 | p102_b_3==1 | p102_b_4==1 | p102_b_5==1 | p102_b_6==1 | p102_b_7==1 | p102_b_8==1 | p102_b_9==1 | p102_b_10==1, VIO_PSI_A:=1]
santiago[p102_b_1!=1 & p102_b_2!=1 & p102_b_3!=1 & p102_b_4!=1 & p102_b_5!=1 & p102_b_6!=1 & p102_b_7!=1 & p102_b_8!=1 & p102_b_9!=1 & p102_b_10!=1, VIO_PSI_A:=0]
santiago[, .N , by=VIO_PSI_A]
##    VIO_PSI_A    N
## 1:         1 1378
## 2:         0 6357
#Generamos variabble Violencia Sexual del año
santiago[p132_b_1==1 |p132_b_2==1 | p132_b_3==1 | p132_b_4==1 | p132_b_5==1 | p132_b_6==1 | p132_b_7==1 | p132_b_8==1, VIO_SEX_A:=1]
santiago[p132_b_1!=1 & p132_b_2!=1 & p132_b_3!=1 & p132_b_4!=1 & p132_b_5!=1 & p132_b_6!=1 & p132_b_7!=1 & p132_b_8!=1, VIO_SEX_A:=0]
santiago[, .N , by=VIO_SEX_A]
##    VIO_SEX_A    N
## 1:         1  270
## 2:         0 7465

Generamos una nueva variable categorica

santiago[VIO_PSI==1, violencia:="Violencia Psicologica"]
santiago[VIO_FIS==1, violencia:="Violencia Fisica"]
santiago[VIO_SEX==1, violencia:="Violencia Sexual"]
santiago[VIO_SEX==1& VIO_PSI==1, violencia:="Violencia Sexual y Psicologica"]
santiago[VIO_SEX==1& VIO_FIS==1, violencia:="Violencia Sexual y Fisica"]
santiago[VIO_FIS==1& VIO_PSI==1, violencia:="Violencia Fisica y Psicologica"]
santiago[VIO_FIS==1& VIO_PSI==1 & VIO_SEX==1 , violencia:="Violencia Fisica, Psicologica y Sexual"]
dataviol=na.omit(santiago$violencia)
dataviol=as.data.table(dataviol)
ggplot(dataviol,aes(x=dataviol))+
  geom_bar()+labs(x="Tipos de Violencia", y="Cantidad de mujeres", title="Personas Encuestadas en la IV Encuesta de violencia contra la mujer en 
el ámbito violencia intrafamiliar y en otros 
espacios en general CHile (ENVIF-VCM)2020", subtitle = "por tipo de violencia", caption = "(ENVIF-VCM)2020")+
  theme(axis.text.x = element_text(angle=0
                                   ,vjust=1))+coord_flip()

Analisis

Dentro de la muestra podemos visualizar a lo largo del país las mujeres que han sufrido violencia intrafamiliar alguna vez en su vida, la mayoría ha sufrido violencia psicológica superando a 1500 mujeres. Le sigue la violencia física y psicológica superando a 500 mujeres y después la violencia física, psicológica y sexual, superando a 250 casos. Llama la atención que dentro de los 3 tipos de violencias que más sufren las mujeres, siempre se encuentra la violencia psicológica.

dataviol2=santiago[region==13]
dataviol3=na.omit(dataviol2$violencia)
dataviol3=as.data.table(dataviol3)
 
ggplot(dataviol3,aes(x=dataviol3))+
  geom_bar()+labs(x="Tipos de Violencia", y="Cantidad de mujeres", title="Personas Encuestadas en la IV Encuesta de violencia contra la mujer en 
el ámbito violencia intrafamiliar y en otros 
espacios en la Region Metropolitana (ENVIF-VCM)2020", subtitle = "por tipo de violencia", caption = "(ENVIF-VCM)2020")+
  theme(axis.text.x = element_text(angle=0
                                   ,vjust=1))+coord_flip()

Analisis:

Dentro de la muestra que se sitúa en la Región Metropolitana, podemos visualizar el mismo orden de violencia intrafamiliar que en el gráfico anterior. Destacando, nuevamente la gran cantidad de mujeres que han sufrido violencia psicológica por sobre las otras.

Mapa

santiago[VIO_PSI==1|VIO_SEX==1|VIO_FIS==1|VIO_FIS==1& VIO_PSI==1|VIO_FIS==1& VIO_SEX==1|VIO_SEX==1& VIO_PSI==1|VIO_SEX==1& VIO_PSI==1 &VIO_FIS==1, violxcom:=1]
datamapa=santiago[!is.na(santiago$violxcom)]
comunas <- mapa_comunas %>% filter(codigo_region==13) 
 
datacomuna<- merge(datamapa,comunas,by.x="comuna", by.y="codigo_comuna")
 
datacomuna<- as.data.table(datacomuna)
b2=datacomuna[,v1:=sum(violxcom),by=.(comuna)]
 
b2 <- distinct(datacomuna) %>% 
  select(comuna, geometry, v1) 
bins<-seq(0,12,1)
b2 <- st_sf(b2)
 
pal <- colorNumeric(    # definimos la paleta de colores
  palette = "BuPu",
  domain = b2$v1)
 
 
mapa <- leaflet() %>% 
  addProviderTiles(providers$CartoDB.Positron) %>% 
  addPolygons(data = b2,
              fillColor = ~pal(v1),
              color = "#000000",  # usamos código Hex para los colores
              fillOpacity = 0.7, # rellenamos con color los polígonos
              smoothFactor = 0.2,
              weight = 1) %>%   # para el grosor de la línea
  addLegend(pal = pal, # paleta de colores 
            values = b2$v1,
            position = "bottomright",
            title = "Casos de Violencia Intrafamiliar por Comuna") %>% 
            addScaleBar(position = "topright") # Agregar escala arriba a la derecha
mapa

Para elaborar el mapa primero se creó una nueva variable denominada violxcom, la cual contiene los tipos de violencia psicológica, física y mental que han sufrido las mujeres encuestadas a lo largo de su vida. Posteriormente se filtró por Región Metropolitana, ya que lo que interesa es saber los casos de violencia dentro de las comunas de la Región Metropolitana para ver si ciertas características del entorno pueden afectar a que las mujeres sufren cierto tipo de violencia. Por último, se creó una nueva variable llamada v1 que contiene la suma de los casos de violencia por comuna.

En el mapa se observan los casos de violencia intrafamiliar por comuna, los cuales están clasificados por colores, desde el más claro (menor número de casos de violencia intrafamiliar) al más oscuro (mayor número de casos de violencia intrafamiliar). Dentro de las comunas que presentan una mayor cantidad de violentadas se encuentran las comunas de Puente Alto, Maipú y Cerro Navia, posteriormente le siguen Ñuñoa, La Florida y San Bernardo. Por otro lado, se observa que, en comunas como La Reina, Vitacura, Lo Barnechea, Conchalí, San Joaquín, La Granja posee un número muy bajo de casos.

Cabe destacar que, por lo general, las comunas con menores ingresos y menor educación, son más propensas a tener mujeres que hayan sufrido alguna vez en su vida violencia intrafamiliar. Sin embargo, las comunas con mayores ingresos igual presentan casos de violencia intrafamiliar. Por lo tanto, la violencia intrafamiliar en la RM es transversal en todas las comunas.

Nos interesa ver como el la distribución de edades en toda la muestra, por lo tanto sacamos un histograma, el cual toma la muestra de todas las entrevistadas de la Región Metropolitana, de manera que obtenemos la siguiente distribución:

ggplot(data = santiago[region == 13],aes(x=edad))+
  geom_histogram(bins = 10)+
  labs(x="Edad", y="Frecuencia", title="Histograma de la edad de las entrevistadas de la Región Metropolitana", subtitle = "Toda la muestra", caption = "Fuente: (ENVIF-VCM)2020")

Ahora nos interesa poder visualizar esta misma información, pero con la condición adicional de que la muestra conste solamente de entrevistadas que sufrieron a lo largo de su vida violencia psicológica.

ggplot(data = santiago[region == 13 & VIO_PSI == 1],aes(x=edad))+
  geom_histogram(bins = 10)+
  labs(x="Edad", y="Frecuencia", title="Histograma de la edad de las entrevistadas en la Región Metropolitana", subtitle = "Mujeres que sufrieron violencia psicológica en la vida", caption = "Fuente: (ENVIF-VCM)2020")

Podemos observar que cuando se trata de haber sufrido al menos una vez en la vida violencia psicológica, esta no presenta una variación muy grande con respecto a la distribución de edades de toda la muestra.

Ahora nos interesa poder visualizar esta misma información, pero con la condición de que la muestra conste de mujeres entrevistadas que sufrieron alguna vez en la vida violencia física.

ggplot(data = santiago[region == 13 & VIO_FIS == 1],aes(x=edad))+
  geom_histogram(bins = 10)+
  labs(x="Edad", y="Frecuencia", title="Histograma de la edad de las entrevistadas en la Región Metropolitana", subtitle = "Mujeres que sufrieron violencia física en la vida", caption = "Fuente: (ENVIF-VCM)2020")

Podemos observar que en este caso la frecuencia de datos disminuye en comparación al gráfico de la violencia psicológica. Además esta disminución en la frecuencia total se ve mayormente representada en una disminución de frecuencia en datos con edades más jóvenes.

Ahora nos interesa poder vizualizar esta misma información, pero con la condición de que la muestra conste de mujeres entrevistadas que sufrieron alguna vez en la vida violencia sexual.

ggplot(data = santiago[region == 13 & VIO_SEX == 1],aes(x=edad))+
  geom_histogram(bins = 10)+
  labs(x="Edad", y="Frecuencia", title="Histograma de la edad de las entrevistadas en la Región Metropolitana", subtitle = "Mujeres que sufrieron violencia sexual en la vida", caption = "Fuente: (ENVIF-VCM)2020")

Podemos observar que en el caso de haber sufrido en la vida violencia sexual, la frecuencia total de datos es menor que en el caso de violencia psicológica y física. Además se puede notar un mayor cambio con respecto a la distribución de edades de la muestra, dado que se puede notar un pick cuando la edad está alrededor de los 25 años, para luego caer y volver a un pick entre los 50 y 75 años.

Con estos graficos podemos concluir que, exceptuando la violencia sexual, la distribución de edades se mantiene independiente de la persona sufrio alguna violencia física o psicológica. No obstante podemos ver un cambio de distribución cuando es violencia sexual. Además la violencia psicológica es la que presenta una mayor frecuencia de datos en comparación a las otras violencias, respaldando lo mencionado anteriormente.

No obstante, los histogramas anteriormente vistos, solamente nos muestran si la mujer ha sufrido a lo largo de la vida alguna de estas violencias, pero no distingue en que edad o periodo de su vida ocurre la violencia, por lo mismo nos interesa hacer los mismos histogramas, pero viendo si cambia en algo al ser una violencia que ocurrió en los últimos 12 meses.

De esta manera obtenemos los siguientes histogramas:

ggplot(data = santiago[region == 13 & VIO_PSI_A == 1],aes(x=edad))+
  geom_histogram(bins = 10)+
  labs(x="Edad", y="Frecuencia", title="Histograma de la edad de las entrevistadas en la Región Metropolitana", subtitle = "Mujeres que sufrieron violencia psicológica en los últimos 12 meses", caption = "Fuente: (ENVIF-VCM)2020")

ggplot(data = santiago[region == 13 & VIO_FIS_A == 1],aes(x=edad))+
  geom_histogram(bins = 10)+
  labs(x="Edad", y="Frecuencia", title="Histograma de la edad de las entrevistadas en la Región Metropolitana", subtitle = "Mujeres que sufrieron violencia física en los últimos 12 meses", caption = "Fuente: (ENVIF-VCM)2020")

ggplot(data = santiago[region == 13 & VIO_SEX_A == 1],aes(x=edad))+
  geom_histogram(bins = 10)+
  labs(x="Edad", y="Frecuencia", title="Histograma de la edad de las entrevistadas en la Región Metropolitana", subtitle = "Mujeres que sufrieron violencia sexual en los últimos 12 meses", caption = "Fuente: (ENVIF-VCM)2020")

Podemos ver de manera general que cuando tomamos los casos de violencia ocurridos en los últimos 12 meses, nuevamente observamos que la que tiene una mayor frecuencia total es la violencia psicológica. Por otro lado tenemos que cuando observamos la violencia psicológica volvemos a la distribución normal de edades. No obstante cuando observamos la violencia física tiene un cambio de distribución en edades, donde alcanza un pick en el intervalo cercano a 25 años mientras que la densidad de frecuencia en los otros intervalos de edades disminuye mucho. Finalmente cuando observamos la violencia sexual podemos observamos que se generan 3 picks, siendo el más frecuente el intervalo de 25 años, 40 años y 65 años, siendo el de 25 el de mayor frecuencia.

De esta manera podemos notar que cuando analizamos actos violentos hacia mujeres durante los últimos 12 meses dentro del ámbito familiar, el rango etario más afectado por cualquier tipo de violencia en el último tiempo es el rango cercano a los 25 años. De la misma manera para la violencia física se presenta mayoritariamente en mujeres del rango de edad de 25 años. Y finalmente en el caso de la violencia sexual, llama la atención los 2 picks que se generan en los rangos etarios cercanos a los 40 años y 65 años.

Regresion 1

En esta regresión tenemos como variables independientes P7: ¿Cuál es el nivel de educación más alto que usted alcanzó? P4: ¿Convive con su pareja? (pololo/a, pareja, esposo) GSE_REC: Grupo Socioeconómico IND_DEP_ECON: Índice de Dependencia Económica Como variable dependiente PV_VIDA: Prevalencia violencia Psicológica, Física o Sexual Vida Que toma los valores 1: Sufrió violencia antes o durante los últimos 12 meses 2: No sufrió violencia antes ni durante los últimos 12 meses Creamos y cambiamos a as.factor las siguientes variables

dataviol2$p7 <- as.factor(dataviol2$p7)
dataviol2$p4 <- as.factor(dataviol2$p4)
dataviol2$GSE_REC <- as.factor(dataviol2$GSE_REC)
dataviol2$PV_VIDA <- as.factor(dataviol2$PV_VIDA)
dataviol2$IND_DEP_ECON <- as.factor(dataviol2$IND_DEP_ECON)
 
dataviol2=dataviol2[PV_VIDA==1|PV_VIDA==2]
 
dataviol2$PV_VIDA <- as.numeric(dataviol2$PV_VIDA)

Corremos la regresion

reg1<-lm(dataviol2,formula=PV_VIDA~p7+p4+GSE_REC+IND_DEP_ECON)
summary(reg1)
## 
## Call:
## lm(formula = PV_VIDA ~ p7 + p4 + GSE_REC + IND_DEP_ECON, data = dataviol2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.8530 -0.5825  0.2796  0.3588  0.7817 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    1.12149    0.24749   4.531 6.89e-06 ***
## p73            0.62338    0.24461   2.548  0.01103 *  
## p74            0.66759    0.24199   2.759  0.00595 ** 
## p75            0.61959    0.24222   2.558  0.01074 *  
## p76            0.59505    0.23918   2.488  0.01308 *  
## p77            0.76803    0.26240   2.927  0.00353 ** 
## p78            0.59416    0.24324   2.443  0.01483 *  
## p79            0.44505    0.25154   1.769  0.07728 .  
## p710           0.62411    0.24575   2.540  0.01131 *  
## p711           0.71062    0.27384   2.595  0.00966 ** 
## p788          -0.03670    0.52768  -0.070  0.94458    
## p799           0.07060    0.52835   0.134  0.89374    
## p42           -0.15619    0.05134  -3.042  0.00244 ** 
## GSE_REC2      -0.03656    0.06265  -0.584  0.55968    
## GSE_REC3      -0.12429    0.07009  -1.773  0.07661 .  
## IND_DEP_ECON1 -0.06781    0.04683  -1.448  0.14809    
## IND_DEP_ECON2  0.03949    0.04083   0.967  0.33382    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4717 on 701 degrees of freedom
##   (522 observations deleted due to missingness)
## Multiple R-squared:  0.05971,    Adjusted R-squared:  0.03825 
## F-statistic: 2.782 on 16 and 701 DF,  p-value: 0.0002279

Realizamos una prediccion y calculamos MAE y RMSE

pred1<-predict(reg1)
dataviol2=as.data.table(dataviol2)
 
predicciones1<-data.table(RMSE=RMSE(pred1,dataviol2$PV_VIDA,na.rm = T),
                         MAE=MAE(pred1,dataviol2$PV_VIDA,na.rm = T))
## Warning in pred - obs: longitud de objeto mayor no es múltiplo de la longitud
## de uno menor

## Warning in pred - obs: longitud de objeto mayor no es múltiplo de la longitud
## de uno menor
predicciones1
##         RMSE       MAE
## 1: 0.4868275 0.4536891

Análisis:

La primera regresión me permite ver como la variable dependiente (PV_VIDA: Prevalencia violencia Psicológica, Física o Sexual Vida) se puede ver afectada por las variables independientes (p7+p4+GSE_REC+IND_DEP_ECON) podían influir en la predicción de la misma variable dependiente. Entonces, para poder hacer un análisis debemos enfocarnos en los errores de predicción de cada uno de los modelos, en el valor de cuadrado y su ajustado, y por último, en analizar el nivel de significancia de las variables independientes. Se puede analizar que en este modelo tiene un RMSE de 0.4868275 y en el MAE sería de 0. 4536891.Con respecto a sus RMSE y MAE, el error puede ser menor y por lo mismo, creemos que se deben evaluar en más detalle las variables que acortan la brecha .Otra observación, es que el R cuadrado del modelo es de 5.971%, por lo tanto, las variables independientes del modelo explican en un 5.971% la variabilidad de los datos y su ajustado es de 3.825%. Se puede concluir, que se necesita una mirada más crítica en la elección de las variables, apelando más al perfil psicológico de la persona para que el modelo de predicción sea más ajustado a la realidad y que la variable p7( nivel de educación) dependiendo de los resultados se obtienen niveles de significancia al 90%, 95% y 99%, entonces es relevante a la hora de predecir la variable independiente.

Creamos una variable con el nombre de la comuna

santiago<-santiago[region==13]
santiago[comuna==13101,Ncomuna:="Santiago"]
santiago[comuna==13102,Ncomuna:="Cerrillos"]
santiago[comuna==13103,Ncomuna:="Cerro Navia"]
santiago[comuna==13104,Ncomuna:="Conchalí"]
santiago[comuna==13105,Ncomuna:="El Bosque"]
santiago[comuna==13106,Ncomuna:="Estación Central"]
santiago[comuna==13107,Ncomuna:="Huechuraba"]
santiago[comuna==13108,Ncomuna:="Independencia"]
santiago[comuna==13109,Ncomuna:="La Cisterna"]
santiago[comuna==13110,Ncomuna:="La Florida"]
santiago[comuna==13111,Ncomuna:="La Granja"]
santiago[comuna==13112,Ncomuna:="La Pintana"]
santiago[comuna==13113,Ncomuna:="La Reina"]
santiago[comuna==13114,Ncomuna:="Las Condes"]
santiago[comuna==13115,Ncomuna:="Lo Barnechea"]
santiago[comuna==13116,Ncomuna:="Lo Espejo"]
santiago[comuna==13117,Ncomuna:="Lo Prado"]
santiago[comuna==13118,Ncomuna:="Macul"]
santiago[comuna==13119,Ncomuna:="Maipú"]
santiago[comuna==13120,Ncomuna:="Ñuñoa"]
santiago[comuna==13121,Ncomuna:="Pedro Aguirre Cerda"]
santiago[comuna==13122,Ncomuna:="Peñalolén"]
santiago[comuna==13123,Ncomuna:="Providencia"]
santiago[comuna==13124,Ncomuna:="Pudahuel"]
santiago[comuna==13125,Ncomuna:="Quilicura"]
santiago[comuna==13126,Ncomuna:="Quinta Normal"]
santiago[comuna==13127,Ncomuna:="Recoleta"]
santiago[comuna==13128,Ncomuna:="Renca"]
santiago[comuna==13129,Ncomuna:="San Joaquín"]
santiago[comuna==13130,Ncomuna:="San Miguel"]
santiago[comuna==13131,Ncomuna:="San Ramón"]
santiago[comuna==13132,Ncomuna:="Vitacura"]
santiago[comuna==13201,Ncomuna:="Puente Alto"]
santiago[comuna==13202,Ncomuna:="Pirque"]
santiago[comuna==13203,Ncomuna:="San José de Maipo"]
santiago[comuna==13301,Ncomuna:="Colina"]
santiago[comuna==13302,Ncomuna:="Lampa"]
santiago[comuna==13303,Ncomuna:="Tiltil"]
santiago[comuna==13401,Ncomuna:="San Bernardo"]
santiago[comuna==13402,Ncomuna:="Buin"]
santiago[comuna==13403,Ncomuna:="Calera de Tango"]
santiago[comuna==13404,Ncomuna:="Paine"]
santiago[comuna==13501,Ncomuna:="Melipilla"]
santiago[comuna==13502,Ncomuna:="Alhué"]
santiago[comuna==13503,Ncomuna:="Curacaví"]
santiago[comuna==13504,Ncomuna:="María Pinto"]
santiago[comuna==13505,Ncomuna:="San Pedro"]
santiago[comuna==13601,Ncomuna:="Talagante"]
santiago[comuna==13602,Ncomuna:="El Monte"]
santiago[comuna==13603,Ncomuna:="Isla de Maipo"]
santiago[comuna==13604,Ncomuna:="Padre Hurtado"]
santiago[comuna==13605,Ncomuna:="Peñaflor"]

Pasamos las variables dependiente a factor y las independientes a numéricas

# X a analizar
#Nacionalidad
santiago$p2<-as.factor(santiago$p2)
#Estado civil
santiago$p3<-as.factor(santiago$p3)
#Se encuentra en pareja actualmente
santiago$p3_1<-as.numeric(santiago$p3_1)
#Vision del machismo
santiago$p64_1<-as.factor(santiago$p64_1)
santiago$p64_2<-as.factor(santiago$p64_2)
santiago$p64_3<-as.factor(santiago$p64_3)
santiago$p64_4<-as.factor(santiago$p64_4)
santiago$p64_5<-as.factor(santiago$p64_5)
santiago$p64_6<-as.factor(santiago$p64_6)
santiago$p64_7<-as.factor(santiago$p64_7)
santiago$p64_8<-as.factor(santiago$p64_8)
santiago$p64_9<-as.factor(santiago$p64_9)
santiago$p64_10<-as.factor(santiago$p64_10)
santiago$p64_11<-as.factor(santiago$p64_11)
santiago$p64_12<-as.factor(santiago$p64_12)
santiago$p64_13<-as.factor(santiago$p64_13)
#Contacto con exterior (frecuencia)
santiago$p65_1<-as.factor(santiago$p65_1)
santiago$p65_2<-as.factor(santiago$p65_2)
santiago$p65_3<-as.factor(santiago$p65_3)
santiago$p65_4<-as.factor(santiago$p65_4)
santiago$p65_5<-as.factor(santiago$p65_5)
santiago$p65_6<-as.factor(santiago$p65_6)
#Donde llega a pedir ayuda
santiago$p67<-as.factor(santiago$p67)
#Contacto con el exterior
santiago$p69_O1<-as.factor(santiago$p69_O1)
santiago$p69_O2<-as.factor(santiago$p69_O2)
santiago$p69_O3<-as.factor(santiago$p69_O3)
santiago$p69_O4<-as.factor(santiago$p69_O4)
santiago$p69_O5<-as.factor(santiago$p69_O5)
santiago$p69_O6<-as.factor(santiago$p69_O6)
santiago$p69_O7<-as.factor(santiago$p69_O7)
santiago$p69_O8<-as.factor(santiago$p69_O8)
santiago$p69_O9<-as.factor(santiago$p69_O9)
santiago$p69_O10<-as.factor(santiago$p69_O10)
santiago$p69_O11<-as.factor(santiago$p69_O11)
santiago$p69_O12<-as.factor(santiago$p69_O12)
santiago$p69_O13<-as.factor(santiago$p69_O13)
santiago$p69_O14<-as.factor(santiago$p69_O14)
santiago$p69_O15<-as.factor(santiago$p69_O15)
#Dependencia economica
santiago$IND_DEP_ECON<-as.factor(santiago$IND_DEP_ECON)
#Violencia sexual niñez
santiago$VDS_14<-as.factor(santiago$VDS_14)
#Red de apoyo
santiago$IND_RED_APOYO<-as.factor(santiago$IND_RED_APOYO)
#Grupo etario
santiago$EDAD_REC<-as.factor(santiago$EDAD_REC)
#Comuna
santiago$Ncomuna<- as.factor(santiago$Ncomuna)
 
# Y a investigar
#Pareja violenta en la vida
santiago$RVGENV_AoV<-as.numeric(santiago$RVGENV_AoV)
#Pareja violenta en los últimos 12 meses.
santiago$RVGEN_AÑO<-as.numeric(santiago$RVGEN_AÑO)
#violencia adulto mayor
santiago$PV_65<-as.numeric(santiago$PV_65)
#Violencia física, psicológica o sexual
santiago$PV_VIDA<-as.numeric(santiago$PV_VIDA)
#Pareja actual cuantas veces llega ebrio
santiago$p43<-as.numeric(santiago$p43)

Regresion 2: FSP VIDA

#Perfil VS Violencia F,P,S (Aceptada)
santiago[PV_VIDA==2,PV_VIDA:=0]
reg5<-lm(data=santiago,formula=PV_VIDA~p3 + p64_7 + p64_13 + p65_3 +p65_5 + p65_6 + p67 + p69_O1 + p69_O2 + p69_O3 + p69_O4 + p69_O5+p69_O12 + IND_DEP_ECON +Ncomuna,na.action=na.exclude)
summary(reg5)
## 
## Call:
## lm(formula = PV_VIDA ~ p3 + p64_7 + p64_13 + p65_3 + p65_5 + 
##     p65_6 + p67 + p69_O1 + p69_O2 + p69_O3 + p69_O4 + p69_O5 + 
##     p69_O12 + IND_DEP_ECON + Ncomuna, data = santiago, na.action = na.exclude)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.0300 -0.3496 -0.1184  0.4039  1.0671 
## 
## Coefficients:
##                             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                 1.033957   0.273348   3.783 0.000166 ***
## p32                        -0.079272   0.243164  -0.326 0.744503    
## p33                         0.625466   0.282765   2.212 0.027232 *  
## p34                         0.322462   0.070188   4.594 4.99e-06 ***
## p35                         0.159237   0.072780   2.188 0.028946 *  
## p36                         0.064833   0.057031   1.137 0.255939    
## p37                         0.104231   0.035979   2.897 0.003863 ** 
## p64_72                      0.198316   0.090308   2.196 0.028359 *  
## p64_73                      0.567479   0.154786   3.666 0.000261 ***
## p64_74                      0.245903   0.081451   3.019 0.002611 ** 
## p64_75                      0.219142   0.081182   2.699 0.007084 ** 
## p64_788                     0.102325   0.229919   0.445 0.656399    
## p64_799                     0.947310   0.485827   1.950 0.051515 .  
## p64_132                    -0.030302   0.036702  -0.826 0.409239    
## p64_133                    -0.116207   0.187235  -0.621 0.534997    
## p64_134                     0.135408   0.128967   1.050 0.294040    
## p64_135                    -0.057242   0.273696  -0.209 0.834384    
## p64_1388                   -0.506685   0.170820  -2.966 0.003099 ** 
## p64_1399                    0.637667   0.832251   0.766 0.443771    
## p65_32                     -0.126874   0.086780  -1.462 0.144105    
## p65_33                     -0.119595   0.058882  -2.031 0.042554 *  
## p65_34                     -0.104922   0.052458  -2.000 0.045804 *  
## p65_388                     0.139016   0.277921   0.500 0.617064    
## p65_399                    -0.065047   0.693597  -0.094 0.925304    
## p65_52                     -0.023548   0.062976  -0.374 0.708559    
## p65_53                     -0.105596   0.068682  -1.537 0.124550    
## p65_54                     -0.101286   0.051574  -1.964 0.049866 *  
## p65_588                    -0.101029   0.166806  -0.606 0.544897    
## p65_599                    -0.072539   0.500913  -0.145 0.884892    
## p65_62                      0.053514   0.234824   0.228 0.819788    
## p65_63                     -0.108359   0.106269  -1.020 0.308171    
## p65_64                      0.141841   0.067413   2.104 0.035663 *  
## p65_688                     0.089710   0.054227   1.654 0.098427 .  
## p65_699                    -0.036230   0.086669  -0.418 0.676031    
## p672                        0.001129   0.080027   0.014 0.988752    
## p673                        0.076268   0.057711   1.322 0.186671    
## p674                        0.061540   0.109024   0.564 0.572589    
## p675                        0.504053   0.242046   2.082 0.037596 *  
## p676                        0.196922   0.163347   1.206 0.228327    
## p677                        0.255309   0.184962   1.380 0.167845    
## p6788                      -0.062351   0.494434  -0.126 0.899677    
## p69_O12                    -0.069658   0.057684  -1.208 0.227543    
## p69_O22                     0.162557   0.083759   1.941 0.052614 .  
## p69_O32                    -0.191148   0.055649  -3.435 0.000621 ***
## p69_O42                    -0.354761   0.179011  -1.982 0.047823 *  
## p69_O52                    -0.107759   0.056408  -1.910 0.056421 .  
## p69_O122                   -0.137963   0.085442  -1.615 0.106744    
## IND_DEP_ECON1               0.010446   0.040748   0.256 0.797743    
## IND_DEP_ECON2              -0.089759   0.036679  -2.447 0.014600 *  
## NcomunaCerrillos           -0.041471   0.148116  -0.280 0.779551    
## NcomunaCerro Navia          0.095930   0.135364   0.709 0.478716    
## NcomunaColina              -0.180327   0.149915  -1.203 0.229362    
## NcomunaConchalí            -0.305677   0.163881  -1.865 0.062489 .  
## NcomunaEl Bosque            0.013462   0.167686   0.080 0.936032    
## NcomunaEl Monte            -0.092092   0.160717  -0.573 0.566790    
## NcomunaEstación Central    -0.308067   0.164650  -1.871 0.061680 .  
## NcomunaHuechuraba          -0.060711   0.176269  -0.344 0.730614    
## NcomunaIndependencia        0.066146   0.157665   0.420 0.674932    
## NcomunaIsla de Maipo       -0.282174   0.198509  -1.421 0.155544    
## NcomunaLa Cisterna          0.013433   0.190375   0.071 0.943766    
## NcomunaLa Florida          -0.082489   0.127328  -0.648 0.517260    
## NcomunaLa Granja           -0.213836   0.190230  -1.124 0.261290    
## NcomunaLa Pintana           0.009763   0.166361   0.059 0.953216    
## NcomunaLa Reina            -0.281248   0.167492  -1.679 0.093484 .  
## NcomunaLampa               -0.328082   0.233544  -1.405 0.160444    
## NcomunaLas Condes          -0.337388   0.125363  -2.691 0.007256 ** 
## NcomunaLo Barnechea        -0.454800   0.212736  -2.138 0.032810 *  
## NcomunaLo Espejo           -0.380054   0.222357  -1.709 0.087774 .  
## NcomunaLo Prado            -0.111285   0.166479  -0.668 0.504018    
## NcomunaMacul               -0.139945   0.146240  -0.957 0.338860    
## NcomunaMaipú               -0.176011   0.123472  -1.426 0.154375    
## NcomunaMelipilla           -0.596108   0.255582  -2.332 0.019913 *  
## NcomunaÑuñoa                0.122866   0.141903   0.866 0.386818    
## NcomunaPaine               -0.102228   0.197220  -0.518 0.604353    
## NcomunaPedro Aguirre Cerda -0.191021   0.142935  -1.336 0.181769    
## NcomunaPeñaflor             0.158092   0.170874   0.925 0.355123    
## NcomunaPeñalolén           -0.287781   0.134194  -2.145 0.032272 *  
## NcomunaPirque              -0.042038   0.198123  -0.212 0.832017    
## NcomunaProvidencia         -0.033465   0.143271  -0.234 0.815366    
## NcomunaPudahuel            -0.445228   0.185967  -2.394 0.016874 *  
## NcomunaPuente Alto         -0.110786   0.131245  -0.844 0.398840    
## NcomunaQuilicura           -0.075162   0.179719  -0.418 0.675889    
## NcomunaRecoleta             0.087959   0.156872   0.561 0.575144    
## NcomunaRenca               -0.174961   0.167575  -1.044 0.296744    
## NcomunaSan Bernardo        -0.081506   0.127801  -0.638 0.523803    
## NcomunaSan Joaquín          0.149088   0.258719   0.576 0.564596    
## NcomunaSan José de Maipo   -0.704755   0.289723  -2.433 0.015198 *  
## NcomunaSan Miguel          -0.168266   0.192688  -0.873 0.382768    
## NcomunaSan Ramón           -0.164492   0.173705  -0.947 0.343925    
## NcomunaSantiago            -0.176598   0.129522  -1.363 0.173096    
## NcomunaTalagante           -0.261877   0.256718  -1.020 0.307970    
## NcomunaVitacura            -0.311141   0.156815  -1.984 0.047559 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4524 on 857 degrees of freedom
##   (291 observations deleted due to missingness)
## Multiple R-squared:  0.2265, Adjusted R-squared:  0.1444 
## F-statistic: 2.758 on 91 and 857 DF,  p-value: 3.544e-14
predict5<-predict(reg5)
predicciones5<-data.table(RMSE=RMSE(predict5,santiago$PV_VIDA, na.rm=T),
                         MAE=MAE(predict5,santiago$PV_VIDA, na.rm=T))
predicciones5
##         RMSE       MAE
## 1: 0.4299556 0.3771692

En esta regresión se consideró la variable dependiente si es que alguna vez en la vida las mujeres han sido violentadas, física, psicológica o sexualmente, es decir la variable PV_VIDA. Dentro de las variables con un nivel alto de significancia se encuentra el estado civil de la persona (p3), destacando principalmente la significancia de los estados civil de anulada, separada, divorciada y soltera. Otra variable significativa sería su opinión sobre la afirmación de que una mujer puede escoger sus amistades independiente de su pareja (p64_7), esta variable explica que entre más desacuerdo con la afirmación mayor probabilidad existe de que fuera violentada. A su vez cuando no saben qué responder frente a la frase de si el hombre puede golpear a la mujer en caso de infidelidad (p64_13), también es significativo. La frecuencia de visita a los amigos (p65_3)también es significante al menos cuando esta es mayor o igual a una visita al mes, en este intervalo disminuye el hecho de que puedan ser violentadas. Cuando las mujeres se comunican más de una vez por semana con sus vecinos es significativo (p65_5), esta situación ayudaría a evitar que sea violentada. Cuando la mujer se dirige a un tercero en caso de ayuda (p67), es significativo cuando esta ayuda es pedida a centros de salud, aumentando la probabilidad de que la mujer sea violentada. Las variables de participación en una organización deportiva, cultural, recreacional (p69_O3) o política, sindicales (p69_O4) son significativas, y disminuye cuando las mujeres no son partícipes de estas. Cuando las mujeres tienen una dependencia económica (IND_DEP_ECON2) alta es significativo, a la vez que esto representa una disminución en la probabilidad de ser violentadas. Además, el lugar en el que vive una mujer también (Ncomuna) es significante cuando pertenece a las siguientes comunas, Las Condes, Lo Barnechea, Melipilla, Peñalolén, Pudahuel, San José de Maipo y Vitacura.

Con respecto a los errores, el RMSE es de 0,4299556 y el MAE de 0,3771692, los cuales son menores a los del modelo 1, lo cual se debe a que en esta segunda regresión se hizo un análisis más profundo con respecto a qué variables considerar. Por otro lado, con respecto al R cuadrado, este aumentó a 22,6%, explicando en un 22,6% la variabilidad de los datos. Con lo anterior se puede ver que el modelo 2 sería una regresión mejor estimada que la del modelo 1, ya que, posee una gran cantidad de variables significativas, los errores disminuyeron y el R cuadrado aumentó, explicando así un mayor porcentaje de la variabilidad de los datos.

Regresion 3: Pareja Violenta

#Perfil VS Pareja violenta en la vida
reg2<-lm(data=santiago,formula=RVGENV_AoV~p64_2+p64_4+p64_5+p64_8+p65_1+p65_4+p65_6+p67+Ncomuna,na.action=na.exclude)
 
summary(reg2)
## 
## Call:
## lm(formula = RVGENV_AoV ~ p64_2 + p64_4 + p64_5 + p64_8 + p65_1 + 
##     p65_4 + p65_6 + p67 + Ncomuna, data = santiago, na.action = na.exclude)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.3226 -0.1009  0.0957  0.2076  6.0843 
## 
## Coefficients:
##                             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                 1.666242   0.233573   7.134 3.60e-12 ***
## p64_22                      0.172857   0.088708   1.949  0.05192 .  
## p64_23                      0.077106   0.121043   0.637  0.52442    
## p64_24                      0.069700   0.094434   0.738  0.46082    
## p64_25                      0.134686   0.117854   1.143  0.25368    
## p64_288                     1.815111   0.896904   2.024  0.04355 *  
## p64_299                    -1.176684   0.528018  -2.228  0.02631 *  
## p64_42                     -0.040926   0.074715  -0.548  0.58411    
## p64_43                      0.024908   0.143845   0.173  0.86260    
## p64_44                      0.079712   0.096088   0.830  0.40719    
## p64_45                      0.061054   0.182761   0.334  0.73848    
## p64_488                    -1.208153   0.526484  -2.295  0.02218 *  
## p64_52                     -0.056125   0.067044  -0.837  0.40293    
## p64_53                     -0.081357   0.158483  -0.513  0.60794    
## p64_54                     -0.059276   0.094126  -0.630  0.52916    
## p64_55                     -0.456681   0.198445  -2.301  0.02180 *  
## p64_588                    -0.327086   0.203635  -1.606  0.10888    
## p64_82                     -0.042331   0.059507  -0.711  0.47720    
## p64_83                      0.045692   0.189176   0.242  0.80925    
## p64_84                     -0.037906   0.101701  -0.373  0.70952    
## p64_85                     -0.326327   0.181943  -1.794  0.07351 .  
## p64_888                    -0.097986   0.500837  -0.196  0.84497    
## p65_12                      0.005431   0.202392   0.027  0.97860    
## p65_13                      0.439637   0.160557   2.738  0.00641 ** 
## p65_14                      0.046483   0.135021   0.344  0.73080    
## p65_199                    -0.165205   0.764863  -0.216  0.82908    
## p65_42                      0.049207   0.130194   0.378  0.70563    
## p65_43                      0.102452   0.084805   1.208  0.22760    
## p65_44                      0.170944   0.066044   2.588  0.00994 ** 
## p65_499                     0.209124   0.536979   0.389  0.69712    
## p65_62                     -0.498410   0.292565  -1.704  0.08910 .  
## p65_63                     -0.069437   0.155688  -0.446  0.65580    
## p65_64                     -0.068989   0.101668  -0.679  0.49773    
## p65_688                     0.154169   0.078884   1.954  0.05123 .  
## p65_699                     0.142289   0.117293   1.213  0.22568    
## p672                       -0.042795   0.130908  -0.327  0.74388    
## p673                        0.195637   0.082493   2.372  0.01811 *  
## p674                        0.037688   0.154367   0.244  0.80722    
## p675                        0.018329   0.269226   0.068  0.94575    
## p676                       -0.214327   0.191390  -1.120  0.26334    
## p677                       -0.941016   0.234652  -4.010 7.03e-05 ***
## p6788                       0.528425   0.563127   0.938  0.34852    
## NcomunaCerrillos            0.006231   0.197649   0.032  0.97486    
## NcomunaCerro Navia         -0.285922   0.197630  -1.447  0.14861    
## NcomunaColina              -0.064769   0.194179  -0.334  0.73886    
## NcomunaConchalí             0.145452   0.219056   0.664  0.50701    
## NcomunaEl Bosque            0.160754   0.245009   0.656  0.51206    
## NcomunaEl Monte            -0.126663   0.238607  -0.531  0.59577    
## NcomunaEstación Central    -0.163455   0.222733  -0.734  0.46339    
## NcomunaHuechuraba          -0.109943   0.246932  -0.445  0.65635    
## NcomunaIndependencia       -0.166298   0.214387  -0.776  0.43831    
## NcomunaIsla de Maipo       -0.030509   0.254723  -0.120  0.90471    
## NcomunaLa Cisterna          0.139709   0.247263   0.565  0.57232    
## NcomunaLa Florida          -0.129354   0.180066  -0.718  0.47288    
## NcomunaLa Granja            0.028916   0.234504   0.123  0.90192    
## NcomunaLa Pintana           0.152912   0.215403   0.710  0.47812    
## NcomunaLa Reina             0.141909   0.275066   0.516  0.60616    
## NcomunaLampa               -0.249287   0.266689  -0.935  0.35039    
## NcomunaLas Condes           0.012351   0.173512   0.071  0.94328    
## NcomunaLo Barnechea        -0.053727   0.272097  -0.197  0.84355    
## NcomunaLo Espejo           -0.187815   0.331831  -0.566  0.57166    
## NcomunaLo Prado            -0.515186   0.244473  -2.107  0.03560 *  
## NcomunaMacul                0.095523   0.215472   0.443  0.65773    
## NcomunaMaipú               -0.021259   0.174174  -0.122  0.90291    
## NcomunaMelipilla           -0.257422   0.318127  -0.809  0.41881    
## NcomunaÑuñoa               -0.282199   0.237441  -1.189  0.23522    
## NcomunaPaine                0.016700   0.234661   0.071  0.94330    
## NcomunaPedro Aguirre Cerda  0.027853   0.206430   0.135  0.89272    
## NcomunaPeñaflor            -0.148621   0.216373  -0.687  0.49249    
## NcomunaPeñalolén           -0.026002   0.196150  -0.133  0.89460    
## NcomunaPirque              -0.514197   0.244616  -2.102  0.03607 *  
## NcomunaProvidencia         -0.000506   0.206361  -0.002  0.99804    
## NcomunaPudahuel            -0.073698   0.327931  -0.225  0.82228    
## NcomunaPuente Alto         -0.124727   0.178858  -0.697  0.48592    
## NcomunaQuilicura           -0.035078   0.244876  -0.143  0.88615    
## NcomunaRecoleta            -0.549734   0.235775  -2.332  0.02013 *  
## NcomunaRenca               -0.412631   0.254824  -1.619  0.10604    
## NcomunaSan Bernardo         0.134965   0.183019   0.737  0.46122    
## NcomunaSan Joaquín          0.254279   0.387065   0.657  0.51153    
## NcomunaSan José de Maipo    0.092340   0.398855   0.232  0.81701    
## NcomunaSan Miguel          -0.342815   0.271128  -1.264  0.20670    
## NcomunaSan Ramón           -0.148806   0.243487  -0.611  0.54139    
## NcomunaSantiago            -0.084299   0.181600  -0.464  0.64271    
## NcomunaTalagante            0.231894   0.516290   0.449  0.65352    
## NcomunaVitacura             0.075655   0.208406   0.363  0.71675    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4764 on 482 degrees of freedom
##   (673 observations deleted due to missingness)
## Multiple R-squared:  0.1981, Adjusted R-squared:  0.05838 
## F-statistic: 1.418 on 84 and 482 DF,  p-value: 0.01355
predict2<-predict(reg2)
 
predicciones2<-data.table(RMSE=RMSE(predict2,santiago$RVGENV_AoV, na.rm=T),
                         MAE=MAE(predict2,santiago$RVGENV_AoV, na.rm=T))
predicciones2
##         RMSE       MAE
## 1: 0.4392153 0.2755487

En la regresión número 3 consideramos como variable dependiente la variable RVGENV_AoV que corresponde a la prevalencia relación de pareja violenta general Vida (año o vida). El objetivo de haber elegido esta variable dependiente fue para ver cómo las variables independientes explican la variable dependiente. En ella se observan varias variables significativas, entre ellas se encuentran (p64_2) la opinión con respecto a que el hombre debe responsabilizarse de los gastos de la familia y del hogar, (p65_1)¿Con qué frecuencia se ve o comunica con personas que considera como familia?, (p65_4) frecuencia con la que se comunica con los vecinos, comuna (NCOMUNA), estas posee un nivel de significancia del 90% ,pedir ayuda amigos (p673) esta posee un nivel de significancia al 95% y por último, (p677) pedir ayuda a otro posee una significancia al 99%. El que la variable p67 tome distintos niveles de significancia, podría explicarse por la correlación entre las variables independientes.

Con respecto a los errores el RMSE toma un valor de 0,4392153, mientras que el MAE toma un valor de 0,2755487. Esta diferencia se puede deber a que se transformaron muchas variables a factor que no son significativas, sin embargo, estas no tienen un error muy grande por lo que por esto el MAE toma un valor más bajo que el RMSE. Por otro lado, que los valores de los errores estén entre 0 y 1, es algo bueno, ya que lo ideal es no tener errores muy grandes dentro de una regresión. En lo que respecta, al R cuadrado esta toma un valor de un 19,81%, lo cual indica que el modelo explica en un 19,81% la variabilidad de los datos.

CONCLUSIÓN

Tras realizar todos estos análisis, una observación que debemos enfocarnos es el carácter cultural que representan las respuestas de las mujeres entrevistadas y cómo se relacionan con el perfilamiento que estamos realizando. Esto se ve representado en las dos últimas regresiones, en donde las respuestas basadas en una cultura machista, suelen ser significativas al momento de ver su relevancia en el perfilamiento, debido a que son las mujeres que tienen un perfil psicológico más asociado a la cultura machista tienen mayor probabilidad de ser violentadas dentro de su hogar. Lo cual, es alarmante no tan solo por la cultura en el que vivimos y no tan solo en la educación de las personas con las que convive o la edad (ya que podemos visualizar que no son variables significativas al momento de realizar la predicción) , sino que estas conductas se ven aumentadas según el espacio en donde se rodea la mujer, esto se puede observar dada la incidencia que tiene la comuna en la que vive la entrevistada, por un lado, en el mapa podemos visualizar un grupo de comunas que tienen un gran número de casos de VIF y por otro lado, podemos observar en las regresiones que existen comunas que son más significativas que otras, es decir, es más probable que una mujer que viva ahí pueda sufrir VIF. Entonces, las características de las mujeres que pueden ser posibles víctimas o mujeres que ya fueron maltratadas, serian las demográficas y las preguntas de sus conductas, a diferencia de lo que se creía en un principio como nivel educacional o su edad, la violencia intrafamiliar es trascendental en temas de grupos socioeconómicos, educación , edad, entre otras.

Igualmente cabe destacar que aún hay cosas que se pueden mejorar de nuestros modelos. Dado que también puede existir un sesgo en los datos por las entrevistadas que, pese a haber sufrido algún tipo de violencia, no dijeron que la sufrieron, por lo que la muestra que según nuestro modelo ha sufrido algún tipo de violencia puede estar subestimada. También los modelos pueden mejorar, en el sentido de que pueden haber otras variables en el error que expliquen el impacto tanto en la variable dependiente como independiente. Finalmente cabe destacar que nos enfocamos principalmente en las 3 violencias principales, pero existen otras como la educacional, laboral o económica. Pese a todo esto podemos observar un gran avance con respecto a las variables necesarias para poder entender el impacto del entorno y sobretodo, como a un nivel psicológico puede influir sobre todo percepciones culturales machistas en la probabilidad de sufrir en un futuro algún tipo de violencia.

Por último, aplicamos el factor de expansión de las mujeres que han sufrido alguna VIF en la RM, y en las 3 principales comunas con mayor número de casos de VIF

santiago[PV_VIDA==1 ,sum(factor_exp,na.rm=T)]
## [1] 1161833
santiago[PV_VIDA==1 & comuna==13201  ,sum(factor_exp,na.rm=T)]
## [1] 73215.18
santiago[PV_VIDA==1 & comuna==13103  ,sum(factor_exp,na.rm=T)]
## [1] 85580.95
santiago[PV_VIDA==1 & comuna==13119   ,sum(factor_exp,na.rm=T)]
## [1] 83953.41

Bibliografía

1. Labrador Encinas, Francisco Javier, & Fernández-Velasco, Mª Rocío, & Rincón, Paulina (2010). Características psicopatológicas de mujeres víctimas de violencia de pareja. Psicothema, 22(1),99-105.[fecha de Consulta 2 de Junio de 2021]. ISSN: 0214-9915. Disponible en: https://www.redalyc.org/articulo.oa?id=72712699016

2. La presente sección dispone las Estadísticas Oficiales de Delitos de Mayor Connotación Social (DMCS), Violencia Intrafamiliar (VIF), Incivilidades y otros hechos informados por Carabineros y la Policía de Investigaciones de Chile al Ministerio del Interior y Seguridad Pública. Disponible en http://cead.spd.gov.cl/estadisticas-delictuales/.

3. Red Chilena contra la Violencia hacia las Mujeres (2020). Dossier informativo 2019-2020. Fecha consultada, 29 de junio de 2021. Disponible en: http://www.nomasviolenciacontramujeres.cl/wp-content/uploads/2020/08/dossier-red-corre.pdf

4. Red Chilena contra la Violencia hacia las Mujeres (2019). Dossier informativo 2018-2019. Fecha consultada, 29 de junio de 2021. Disponible en: http://www.nomasviolenciacontramujeres.cl/wp-content/uploads/2020/08/dossier-red-corre.pdf

5. Recuperado de SERNAMEG el día 29 de junio de 2021. Disponible en: https://www.sernameg.gob.cl/?page_id=26815

6. Torres Andrea, Lemos-Giráldez Serafín, Herrero Juan. Violencia hacia la mujer: características psicológicas y de personalidad de los hombres que maltratan a su pareja. Anal. Psicol. [Internet]. 2013 Ene [citado 2021 Jun 03] ; 29( 1 ): 9-18. Disponible en: http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S0212-97282013000100002&lng=es. https://dx.doi.org/10.6018/analesps.29.1.130621.

7.“RASGOS DE PERSONALIDAD EN VÍCTIMAS DE VIOLENCIA INTRAFAMILIAR” (2014). disponible en: http://biblio3.url.edu.gt/Tesario/2014/05/42/Mazariegos-Ingrid.pdf

9. Puente-Martínez, Alicia, Ubillos-Landa, Silvia, Echeburúa, Enrique, & Páez-Rovira, Darío. (2016). Factores de riesgo asociados a la violencia sufrida por la mujer en la pareja: una revisión de meta-análisis y estudios recientes. Anales de Psicología, 32(1), 295-306. https://dx.doi.org/10.6018/analesps.32.1.189161

10. Villegas. M (2017) Violencia contra la mujer en Chile y derechos humanos. PDF