#

El presente trabajo analiza la posibilidad de existencia de datos atípicos en cada uno de los diferentes motivos por los que una persona de género masculino podría justificar la violencia de género hacia su pareja (mujer); el análisis se realiza en seis preguntas consideradas en una encuesta que busca determinar la cantidad porcentual de encuestados que justifican la violencia y los motivos para hacerlo; se trabaja con una base de datos para Colombia.

procedemos a importar los datos

datostabla <- read_excel("datostabla.xlsx")
violence <- data.frame(datostabla, row.names = "Demographics")

A continuación, se analizarán los datos atípicos, en caso de que existan, y se identificará a qué característica del perfil del individuo corresponde dicha justificación; así mismo, se analizará la posibilidad de realizar o no un tratamiento a los datos atípicos encontrados y los motivos para la decisión tomada al respecto.

En la siguiente tabla se detalla las etiquetas correspondiente a cada pregunta:

Etiqueta Pregunta
P1 Violencia por alguna razón en especifica
P2 Violencia si discute con él
P3 Violencia si ella quema la comida
P4 Violencia si ella sale sin decirle
P5 Violencia si ella descuida a los niños
P6 Violencia si ella se reúsa a tener relaciones sexuales

En primer lugar, se realiza un análisis visual de los datos obtenidos con un gráfico de cajas y bigotes para cada pregunta.

boxplot(violence , names = c('P1',"P2",'P3','P4','P5','P6'), main= "Grafico 1: cajas y bigotes",ylab = "%")

Como se observa en el gráfico 1, las preguntas que presentan datos atípicos significativos son:

Es posible observar lo mencionado dado que en la P1 existe un dato atípico muy alejado del bigote superior; en P3 existe un dato atípico alejado del bigote superior, su distancia no es grande en relación a la presentada en P1, por ejemplo, pero resulta ser significativa para el efecto; en P5 se presentan tres datos atípicos, dos alejados del bigote superior y uno del bigote inferior y en P6 existen dos datos atípicos alejados del bigote superior.

En el caso de las preguntas P2 (Si la mujer discute con su pareja) y la P4 (Si la mujer sale de casa sin avisarle a su pareja), no se presentan datos atípicos, o al menos, no significativos o considerables; es decir, en la pregunta 2 no se visualiza ningún atípico; mientras que en la 4, el posible dato atípico que se presenta se encuentra superpuesto al límite del bigote superior, por lo que no parece estar significativamente distante al resto de datos.

Lo observado en el análisis visual de los datos, se corroborará, a continuación, con el análisis de la normalidad de los mismos y el test de Grubbs, que identifica la presencia de datos atípicos en una muestra.

Grafico 2 : Histogramas pra cada una de las preguntas

Conf3x2 = matrix(c(1:6), nrow=2, byrow=TRUE)
lay.1 = layout(Conf3x2)
hist(violence$for.at.least.one.specific.reason , probability = TRUE, main = 'P1')
lines(density(violence$for.at.least.one.specific.reason),col="red")
hist(violence$if.she.argues.with.him,probability = TRUE, main = 'P2')
lines(density(violence$if.she.argues.with.him),col="red")
hist(violence$if.she.burns.the.food ,probability = TRUE, main = 'P3')
lines(density(violence$if.she.burns.the.food),col="red")
hist(violence$if.she.goes.out.without.telling.him , probability = TRUE,main = 'P4')
lines(density(violence$if.she.goes.out.without.telling.him),col="red")
hist(violence$if.she.neglects.the.children,probability = TRUE, main = 'P5')
lines(density(violence$if.she.neglects.the.children),col="red")
hist(violence$if.she.refuses.to.have.sex.with.him, probability = TRUE, main = 'P6')
lines(density(violence$if.she.refuses.to.have.sex.with.him),col="red")

En el gráfico 2, que busca analizar si las distribuciones de cada variable analizada son normales, se puede apreciar que las preguntas 1, 3, 5 y 6 presentan distribuciones no normales debido a los datos atípicos que poseen; mientras que las preguntas 2 y 4 parecen seguir un comportamiento más aproximado al normal, dado que sus datos atípicos no existen o nos son considerados significativo, así:

  • P1 : Esta variable presenta un comportamiento no normal y es posible apreciar, en el análisis gráfico, que posee un dato atípico significativo, que se encuentra más alejado que el resto de datos, en la cola derecha de la distribución; esta distancia se considera significativa.

  • P2 : No parece presentar datos atípicos ya que el comportamiento parece ser normal y todos los datos parecen estar agrupados en aproximadamente la misma región (comportamiento similar entre sí).

  • P3 : Esta variable también presenta un dato atípico significativo en la cola derecha de la distribución, ya que se encuentra más alejado del resto de datos.

  • P4 : En esta variable tampoco se presentan datos atípicos significativos ya que no existe ningún dato que se encuentre muy alejado del resto de datos en la distribución; si bien existe un dato que sobresale un poco más que el resto, situados en la cola derecha, este no se considera como atípico y se podría decir que se tiene un comportamiento normal o aproximadamente normal; además, si bien existe un dato en la cola derecha que sobresale (en altura) del resto de datos, este no es considerado como un atípico significativo, ya que no se encuentra alejado del resto de datos, como sucede en otras variables; esto fue posible observar también en el gráfico de cajas y bigotes, en el cual dicho dato se encontraba justo en el límite del bigote superior.

  • P5 : Al igual que en P3, en esta variable existe un dato atípico significativo en la cola derecha de la distribución, ya que este se encuentra alejado del resto de datos de la misma; si bien existen también dos datos que podrían ser considerados como atípicos, uno en cada cola de la distribución, estos no parecen ser muy significativos, puesto que se encuentran cercanos al resto de datos de la distribución.

  • P6 : En esta pregunta es posible observar dos datos que se encuentran más alejados del resto de datos que conforman la distribución, ambos en la cola derecha de la misma.

Para considerarlos como datos atípicos en el caso del análisis gráfico de la distribución normal, se observa que aquellos datos cuya distancia del resto se considera significativa, son los que presentan, antes de ellos, un espacio o segmento en el que no existen otros datos, lo que demuestra la distancia mencionada.

Además, según la teoría, cuando existe un dato atípico que no permite que la forma de la distribución de todos los datos sea normal, se considera que dicho dato atípico se encuentra separado de las demás observaciones o que este no pertenece a la misma distribución que los demás; en un sentido de análisis estadístico, esta característica se puede expresar o analizar con el Test de Grubbs que plantea como hipótesis nula el hecho de que la muestra no presente ningún dato atípico y como hipótesis alternativa que la muestra presente al menos un dato atípico.

Cabe recalcar que el Test de Grubbs no sólo se basa en la normalidad de los datos, sino que también analiza si estos son independientes entre sí. Ante ello, es importante aclarar que las variables utilizadas para el presente estudio, así como las características de los individuos que respondieron a las preguntas de la encuesta realizada, sí son independientes entre sí, dado que la respuesta que pueden dar a una variable no influye en la respuesta que le den a otra.

Con ello en mente, se realiza a continuación el Test de Grubbs para cada variable, mismo que permitirá contrastar o reafirmar los resultados obtenidos en los análisis realizados anteriormente. Es primordial mencionar que el Test de Grubbs puede ser realizado para tres casos diferentes: Identificación de un sólo dato atípico en la muestra; identificación de datos atípicos a cada extremo de la muestra e identificación de dos datos atípicos a un mismo extremo de la muestra.

Se presentan a continuación los Tests realizados para cada variable, sus resultados y su interpretación.

Pregunta 1

grubbs.test(violence$for.at.least.one.specific.reason)
## 
##  Grubbs test for one outlier
## 
## data:  violence$for.at.least.one.specific.reason
## G = 2.95997, U = 0.32948, p-value = 0.001416
## alternative hypothesis: highest value 13.2 is an outlier

Se obtiene un p-valor < 0.05 por lo que se rechaza la hipótesis nula de no presencia de valores atípicos en el conjunto de datos, además se puede ver que el dato atípico es 13.2% el cual corresponde a personas sin educación.

Pregunta 2

grubbs.test(violence$if.she.argues.with.him)
## 
##  Grubbs test for one outlier
## 
## data:  violence$if.she.argues.with.him
## G = 1.86190, U = 0.73469, p-value = 0.3707
## alternative hypothesis: lowest value 0.7 is an outlier

En este caso no rechazamos la hipótesis nula ya que p-valor > 0.05, es decir que para esta pregunta no se tienen datos atípicos según el test.

Pregunta 3

grubbs.test(violence$if.she.burns.the.food)
## 
##  Grubbs test for one outlier
## 
## data:  violence$if.she.burns.the.food
## G = 2.66861, U = 0.45499, p-value = 0.01255
## alternative hypothesis: highest value 2.8 is an outlier

Para este caso si rechazamos la hipótesis nula , ya que se obtiene un p-valor inferior a 0.05 además, el dato atípico es de 2.8%, el cual al igual que en el caso de P1 corresponde a personas sin educación.

Pregunta 4

grubbs.test(violence$if.she.goes.out.without.telling.him)
## 
##  Grubbs test for one outlier
## 
## data:  violence$if.she.goes.out.without.telling.him
## G = 2.07344, U = 0.67098, p-value = 0.1903
## alternative hypothesis: highest value 3.2 is an outlier

En esta pregunta según el test tenemos que no hay datos atípicos ya que no rechazamos la hipótesis nula.

Pregunta 5

grubbs.test(violence$if.she.neglects.the.children, type=20)
## 
##  Grubbs test for two outliers
## 
## data:  violence$if.she.neglects.the.children
## U = 0.18562, p-value < 2.2e-16
## alternative hypothesis: highest values 5.4 , 9.4 are outliers

Para esta variable se corrió dos versiones del test de grubbs el normal que se realizó en las anteriores preguntas y una versión que nos permite detectar si el conjunto de datos contiene dos valores atípicos en el mismo extremo de la distribución normal, en ambos casos rechazamos la hipótesis nula y además se pudo observar que se tienen dos datos atípicos los cuales son 5.4 y 9.4 que corresponden de igual forma que antes a personas sin educación y a personas con educación primaria.

Pregunta 6

grubbs.test(violence$if.she.refuses.to.have.sex.with.him)
## 
##  Grubbs test for one outlier
## 
## data:  violence$if.she.refuses.to.have.sex.with.him
## G = 2.68691, U = 0.44749, p-value = 0.01121
## alternative hypothesis: highest value 4.2 is an outlier

Obtenemos un p-valor inferior a 0.05 por lo que se rechaza la hipótesis nula y además tenemos el valor de 4.2 como dato atípico, el cual de la misma forma que los casos anteriores corresponde a personas sin educación.

Los tests realizados, así como el análisis visual de cajas y bigotes y de comportamiento en distribución de los datos, han permitido encontrar y afirmar la existencia de datos atípicos significativos en cuatro de las seis preguntas (variables) analizadas.

Al contrastar los datos atípicos encontrados con la información proporcionada por la base de datos, se ha podido descubrir que todos los datos atípicos están relacionados con el nivel de educación que poseen los individuos; así, en la mayoría de los casos, los individuos que no poseen educación o únicamente han alcanzado niveles bajos de la misma, son los datos atípicos encontrados en la muestra, para cada una de las diferentes variables que los presentan.

Llama la atención el hecho de que en la pregunta 5 (si la mujer descuida a los niños), se presente un dato atípico cuando la educación de los individuos no sólo es nula o baja, sino que es alta; en todo caso, el motivo para la justificación de la violencia por este y los otros motivos, sigue siendo la misma: el nivel de educación alcanzada por los individuos.

Con el objetivo de encontrar motivos que justifiquen o expliquen los resultados obtenidos, se ha realizado una revisión de la literatura existente respecto a la violencia de género, sus causas, consecuencias y formas de expresión; en la misma, se ha podido encontrar información relevante sobre la relación que existe entre la violencia de género y los niveles de educación de quienes la ejecutan.

Así, por ejemplo, el (Instituto Nacional de Desarrollo Social INDESOL, 2006), en su informe sobre las Causas, Efectos y Expresiones de la Violencia menciona que los roles aprendidos en la familia, la comunidad y la escuela educan a hombres y mujeres a una convivencia basada en el sometimiento de unas respecto a los otros; esto se puede dar debido a que, al formar la familia, las nuevas generaciones organizan su vida de forma muy similar a como lo hicieron las generaciones anteriores, aunque con la incorporación de valores del entorno actual, más equitativos en torno a las relaciones de género.

Sin embargo, la falta de modelos asentados y de institucionalización de las nuevas pautas de conducta incrementan las diferencias y tensiones dentro de las familias, con lo que el maltrato persiste e incluso aumenta, como vía de escape a los desafíos y las presiones de la crisis económica y de seguridad. Lo citado anteriormente demuestra que, a pesar de que los valores actuales están más direccionados a la reducción de la violencia de género, la falta de información y educación al respecto, es un factor determinante para que dicho objetivo no sea logrado e, incluso, se agrave.

Así mismo, se identifica como discurso “machista” justificador de la violencia a dos formas de aplicación de la misma: la preventiva que apoya su discurso en un motivo más limitante, es prohibitivo, discrimina por género y tiene como objetivo conseguir el reconocimiento de la autonomía masculina; y la correctiva, que aparece cuando el agresor estima que ha sido transgredida una orden que este ha dado o que el papel de género que le corresponde a cada miembro del hogar ha sido incumplido.

Dicho discurso se expresa con términos que justifican y autorizan a los hombres, al menos a las cabezas de la familia, a golpear a sus parejas, castigarlas, tomar posesión de sus cosas y de su cuerpo y de disponer de su tiempo y sus expectativas a futuro.

Cuando los individuos de género masculino no poseen ningún nivel de educación o su nivel de educación es bajo, la única educación que poseen será la que habrán recibido de sus hogares o su sociedad; sin embargo, en la mayoría de sociedades, los hombres tienen gran permisibilidad, pues se espera que experimenten, exploren, conquisten y que sean aventureros en terrenos de la economía, la innovación, la sexualidad y los placeres de todo tipo y, además, es el hombre quien deberá, obligatoriamente, ser ambicioso, pues será considerado como proveedor y conquistador en el ámbito familiar.

En resumen, la construcción social de los géneros equipara en todo lo posible la educación del niño a la vida y virtudes de un militar y la educación de la niña a la vida y virtudes de una madre. En cuanto a la sexualidad, él está formado para pedir y ella para no dar. En cuanto a la promoción social, él está formado para triunfar y ella para soportar, él para conquistar, ella para conformarse. En el conflicto, él está formado para golpear y ella para llorar y resignarse. Todos estos aspectos socioculturales potencian los motivos para que el hombre justifique la violencia por diferentes motivos y que este mismo tenga mayores probabilidades de violentar a su pareja por los mismos motivos.

Así mismo, según el estudio realizado por (Durán, Campos, & Martínez, 2014), el nivel educativo se ha mostrado relacionado con la tolerancia hacia la violencia contra las mujeres. Aunque hay estudios que muestran una relación de tipo negativo entre este factor y la justificación de la violencia hacia la mujer por parte de su pareja (e.g., Yoshioka et al., 2001); es decir, a mayor nivel educativo menor tolerancia hacia la violencia de género, otros trabajos muestran la existencia de actitudes tolerantes hacia la violencia contra las mujeres en personas altamente cualificadas, como por ejemplo en estudiantes universitarios de diferentes titulaciones (Bessette y Peterson, 2002; Ferrer et al., 2011), y también en colectivos de profesionales, como médicos y enfermeros.

Como se observa, existen varios estudios que analizan la influencia de los niveles de educación en la incidencia de la violencia de género, mismos que permiten explicar los motivos para la existencia de los datos atípicos que fueron encontrados en el presente estudio. Finalmente, se tienen algunas formas de proceder ante la presencia de datos atípicos de acuerdo al caso, por ejemplo, se pueden eliminar o reemplazar por la media u otras medidas obtenidas a partir de la estadística descriptiva. Sin embargo, este no es el caso, ya que este estudio tiene como objetivo identificar el perfil del individuo de género masculino que que sea más propenso a cometer algún acto de violencia en contra de su pareja, por lo que no se realiza modificación alguna en el conjunto de datos con el que se trabaja; además, son precisamente esos datos atípicos los que permiten identificar las características que destacan en los individuos que justifican la violencia por los motivos analizados.

Referencias

  • Bessette, H. D. y Peterson, S. S. (2002). Attitudes of nurse practitioner students toward woman experiencing domestic violence. Journal of Nursing Education, 41, 227-230.

  • Durán, M., Campos, I., & Martínez, R. (2014). Obstáculos en la Comprensión de la Violencia de Género: Influencia del Sexismo y la Formación en Género. Acción Psicológica.

  • Instituto Nacional de Desarrollo Social INDESOL. (2006). Diagnóstico sobre las Causas, Efectos y Expresiones de Violencia Contra las Mujeres en los Hogares de la Microrregión Huasteca Centro del Estado San Luis de Potosí. México: Cuate.

  • Yoshioka, M. R., Dinoia, J. y Ullah, K. (2001). Attitudes toward marital violence: An examination of four Asian communities. Violence Against Women, 7, 900-926.