TEMA DE INVESTIGACIÓN

El sexo como principal factor detrás de las víctimas de trata de personas en el Perú en 2017.

Pregunta de investigación: ¿Qué factores influyen en las tasas de trata de personas en el Perú en 2017?

Usamos el comando str para solicitar la estrura de las variables

'data.frame':   24 obs. of  12 variables:
 $ ...1            : chr  "Amazonas" "Ancash" "Apurimac" "Arequipa" ...
 $ MUJERES         : chr  "49.3" "50.4" "50.2" "50.6" ...
 $ INMIGRANTES     : num  NA NA 0.5 2.8 0.8 1.3 1.8 0.3 1.2 2.8 ...
 $ EMIGRANTES      : num  2.4 6.8 3.8 2.9 5 10.7 5.3 4.8 4.9 2.4 ...
 $ URBANO          : num  45 61 40 90 55 35 56 23 39 92 ...
 $ RURAL           : num  55 39 60 10 45 65 44 77 61 8 ...
 $ SOCIOECO_MUYBAJO: num  67.7 46.5 74.3 17.5 71.2 69.4 58.1 83 66.7 13.4 ...
 $ ASISTENCIA_SEC  : num  80.8 86.1 88 90.5 86.5 81.5 84.7 87.4 77.4 90.6 ...
 $ PEAOCUPADA_FEM  : num  48.8 48.3 51.8 46.6 49.9 51.6 50.2 54.8 49.3 43.1 ...
 $ CASOSCEM        : num  1200 3883 1706 9532 3050 ...
 $ ASISTENCIA_SUP  : num  61.1 59.4 79.9 83.3 53.6 48.9 84.3 58.4 56.6 69 ...
 $ VICTIMAS        : num  20 20 3 70 26 18 45 13 11 17 ...

Variable dependiente

Número de víctimas de trata de personas por departamentos del Perú en el 2017 y es una variable cuantitativa discreta.

Análisis descriptivo

Ahora analicemos las medidas de tendencia central, de dispersión y de posición. ¿Qué podemos comentar de los datos obtenidos?

  Mínimo  Media Mediana Desviación Máximo
1      3 40.625    21.5   47.75555    235

A continuación, graficamos. Como la variable VICTIMAS es numérica, esta vez realizaremos un histograma.

Variables Independientes

3.1. Porcentaje de habitantes de sexo femenino (MUJERES)

Análisis descriptivo de la variable independiente

   Min    Media Mediana Desviación  Max   Q1   Q3
1 47.2 49.99583    50.2   0.912464 51.2 49.3 50.6

Grafiquemos

Generemos el gráfico que mejor permite ver estas medidas de posición

Hipótesis de la prueba de correlación H0: No existe correlación entre el número de víctimas de trata de personas en el 2017 y el porcentaje de habitantes de sexo femenino que hay en cada departamento.


    Pearson's product-moment correlation

data:  data$VICTIMAS and data$MUJERES
t = 0.46637, df = 22, p-value = 0.6455
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.3171117  0.4830583
sample estimates:
       cor 
0.09894186

3.2. Porcentaje de población inmigrante según departamento de nacimiento (INMIGRANTES)

Análisis descriptivo de la variable independiente

  Min    Media Mediana Desviación  Max    Q1  Q3
1 0.3 3.931818     1.5     10.376 50.1 0.825 2.8

Grafiquemos

Generemos el gráfico que mejor permite ver estas medidas de posición

Gráfico de dispersión

Hipótesis de la correlación H0 = No existe correlación entre el porcentaje de población inmigrante según departamento de nacimiento y el número de víctimas de trata de personas en el 2017.


    Pearson's product-moment correlation

data:  data$VICTIMAS and data$INMIGRANTES
t = 7.7734, df = 20, p-value = 1.812e-07
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.7015668 0.9435735
sample estimates:
      cor 
0.8667904

3.3. Porcentaje de población rural según departamento (RURAL)

Análisis descriptivo de la variable independiente

  Min  Media Mediana Desviación Max   Q1    Q3
1   2 32.875      33   20.52001  77 19.5 45.25

Grafiquemos

Generemos el gráfico que mejor permite ver estas medidas de posición

Gráfico de dispersión

Visualizamos la relación entre dos variables cuantitativas.

Hipótesis de la correlación H0 = No existe correlación entre el porcentaje de población rural según departamento y el número de víctimas de trata de personas en el 2017.


    Pearson's product-moment correlation

data:  data$VICTIMAS and data$RURAL
t = -1.9975, df = 22, p-value = 0.05828
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.68668087  0.01374973
sample estimates:
       cor 
-0.3918202

3.4. Porcentaje de habitantes que pertencen a un nivel socieconómico muy bajo (SOCIOECO_MUYBAJO)

Análisis descriptivo de la variable independiente

  Min    Media Mediana Desviación Max    Q1    Q3
1 9.3 48.05217    48.6    21.5068  83 33.55 66.35

Grafiquemos

Generemos el gráfico que mejor permite ver estas medidas de posición

Gráfico de dispersión

Hipótesis de la correlación H0 = No existe correlación entre el porcentaje de habitantes que pertencen a un nivel socieconómico muy bajo y el número de víctimas de trata de personas en el 2017.


    Pearson's product-moment correlation

data:  data$VICTIMAS and data$SOCIOECO_MUYBAJO
t = -1.9163, df = 21, p-value = 0.06903
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.68851126  0.03139256
sample estimates:
       cor 
-0.3858019

3.5. Tasa neta de asistencia escolar a educación secundaria de la población de 12 a 16 años de edad, 2017 (ASISTENCIA_SEC)

Análisis descriptivo de la variable independiente

   Min    Media Mediana Desviación  Max    Q1    Q3
1 74.6 84.35833    85.1   4.782206 91.5 81.25 87.55

Grafiquemos

Generemos el gráfico que mejor permite ver estas medidas de posición

Gráfico de dispersión

Visualizamos la relación entre dos variables cuantitativas.

Hipótesis de la correlación H0 = No existe correlación entre la tasa neta de asistencia escolar a educación secundaria de la población de 12 a 16 años de edad, y el número de víctimas de trata de personas en el 2017.


    Pearson's product-moment correlation

data:  data$VICTIMAS and data$ASISTENCIA_SEC
t = 0.71533, df = 22, p-value = 0.4819
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.2689901  0.5223918
sample estimates:
      cor 
0.1507662

3.6. Tasa de población económicamente activa ocupada femenina (PEACOUPADA_FEM)

Análisis descriptivo de la variable independiente

   Min   Media Mediana Desviación  Max     Q1    Q3
1 39.8 46.8125    46.7   3.741694 54.8 43.925 49.45

Grafiquemos

Generemos el gráfico que mejor permite ver estas medidas de posición

Gráfico de dispersión

Visualizamos la relación entre dos variables cuantitativas.

Hipótesis de la correlación H0 = No existe correlación entre la tasa de población económicamente activa ocupada femenina y el número de víctimas de trata de personas en el 2017.


    Pearson's product-moment correlation

data:  data$VICTIMAS and data$PEAOCUPADA_FEM
t = -1.0072, df = 22, p-value = 0.3248
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.5654628  0.2113374
sample estimates:
       cor 
-0.2099589

3.7. Casos de violencia reportados en los CEM (CASOSCEM)

Análisis descriptivo de la variable independiente

  Min    Media Mediana Desviación   Max      Q1     Q3
1 612 3868.667  2486.5   5668.184 28550 1415.25 3800.5

Grafiquemos

Generemos el gráfico que mejor permite ver estas medidas de posición

Gráfico de dispersión

Visualizamos la relación entre dos variables cuantitativas.

Hipótesis de la correlación H0 = No existe correlación entre los casos de violencia reportados en los CEM y el número de víctimas de trata de personas en el 2017.


    Pearson's product-moment correlation

data:  data$VICTIMAS and data$CASOSCEM
t = 9.0605, df = 22, p-value = 7.042e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.7552079 0.9508302
sample estimates:
      cor 
0.8880589

Regresiones

REGRESION GAUSSIANA

Ajustar el modelo de regresión para porcentaje de población femenina y victimas de la trata de personas


Call:
lm(formula = VICTIMAS ~ MUJERES, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-38.682 -26.780 -16.352   9.514 189.693 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept) -218.269    555.218  -0.393    0.698
MUJERES        5.178     11.104   0.466    0.646

Residual standard error: 48.59 on 22 degrees of freedom
Multiple R-squared:  0.009789,  Adjusted R-squared:  -0.03522 
F-statistic: 0.2175 on 1 and 22 DF,  p-value: 0.6455

Ajustar el modelo de regresión para porcentaje de población inmigrante y victimas de la trata de personas


Call:
lm(formula = VICTIMAS ~ INMIGRANTES, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-26.368 -20.661  -6.041  12.951  59.287 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  26.2303     5.7880   4.532 0.000203 ***
INMIGRANTES   4.1380     0.5323   7.773 1.81e-07 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 25.31 on 20 degrees of freedom
  (2 observations deleted due to missingness)
Multiple R-squared:  0.7513,    Adjusted R-squared:  0.7389 
F-statistic: 60.43 on 1 and 20 DF,  p-value: 1.812e-07

Ajustar el modelo de regresión para porcentaje de población rural y victimas de la trata de persona


Call:
lm(formula = VICTIMAS ~ RURAL, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-48.365 -30.248  -2.009   9.540 166.221 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  70.6027    17.5874   4.014 0.000582 ***
RURAL        -0.9119     0.4565  -1.998 0.058283 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 44.92 on 22 degrees of freedom
Multiple R-squared:  0.1535,    Adjusted R-squared:  0.115 
F-statistic:  3.99 on 1 and 22 DF,  p-value: 0.05828

Ajustar el modelo de regresión para porcentaje de población en nivel socioeconómico muy bajo y victimas de la trata de personas


Call:
lm(formula = VICTIMAS ~ SOCIOECO_MUYBAJO, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-62.743 -21.640  -5.295   7.766 159.277 

Coefficients:
                 Estimate Std. Error t value Pr(>|t|)   
(Intercept)       83.7539    23.6359   3.543  0.00192 **
SOCIOECO_MUYBAJO  -0.8635     0.4506  -1.916  0.06903 . 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 45.45 on 21 degrees of freedom
  (1 observation deleted due to missingness)
Multiple R-squared:  0.1488,    Adjusted R-squared:  0.1083 
F-statistic: 3.672 on 1 and 21 DF,  p-value: 0.06903

Ajustar el modelo de regresión lineal para indice de asitencia a educación secundaria y victimas de la trata de personas


Call:
lm(formula = VICTIMAS ~ ASISTENCIA_SEC, data = data)

Residuals:
   Min     1Q Median     3Q    Max 
-47.38 -22.16 -13.97  13.01 188.59 

Coefficients:
               Estimate Std. Error t value Pr(>|t|)
(Intercept)     -86.382    177.823  -0.486    0.632
ASISTENCIA_SEC    1.506      2.105   0.715    0.482

Residual standard error: 48.27 on 22 degrees of freedom
Multiple R-squared:  0.02273,   Adjusted R-squared:  -0.02169 
F-statistic: 0.5117 on 1 and 22 DF,  p-value: 0.4819

Ajustar el modelo de regresión para población economicamente activa ocupada femenina y victimas de la trata de personas


Call:
lm(formula = VICTIMAS ~ PEAOCUPADA_FEM, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-45.502 -24.712  -8.283   8.268 186.034 

Coefficients:
               Estimate Std. Error t value Pr(>|t|)
(Intercept)      166.07     124.92   1.329    0.197
PEAOCUPADA_FEM    -2.68       2.66  -1.007    0.325

Residual standard error: 47.74 on 22 degrees of freedom
Multiple R-squared:  0.04408,   Adjusted R-squared:  0.000632 
F-statistic: 1.015 on 1 and 22 DF,  p-value: 0.3248

Ajustar el modelo de regresión para casos de violencia reportados y victimas de la trata de personas


Call:
lm(formula = VICTIMAS ~ CASOSCEM, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-21.444 -16.132  -7.328   8.847  53.963 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 1.168e+01  5.586e+00   2.091   0.0483 *  
CASOSCEM    7.482e-03  8.258e-04   9.060 7.04e-09 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 22.45 on 22 degrees of freedom
Multiple R-squared:  0.7886,    Adjusted R-squared:  0.779 
F-statistic: 82.09 on 1 and 22 DF,  p-value: 7.042e-09

Ya que fueron las variables independientes “INMIGRANTES” y “CASOSCEM” las que resultaron con correlación significativa, se las está usando para el modelo.

Ahora…..¿El modelo es valido? ANOVA


Call:
lm(formula = VICTIMAS ~ INMIGRANTES + CASOSCEM, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-22.840 -16.468  -6.547   5.200  50.701 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)  
(Intercept) 15.880089   7.127706   2.228   0.0382 *
INMIGRANTES  1.204899   1.432602   0.841   0.4108  
CASOSCEM     0.005485   0.002519   2.178   0.0422 *
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 23.23 on 19 degrees of freedom
  (2 observations deleted due to missingness)
Multiple R-squared:  0.801, Adjusted R-squared:  0.7801 
F-statistic: 38.24 on 2 and 19 DF,  p-value: 2.183e-07

En este caso, al obtener un p-valor menor a 0.05 podemos rechazar la hipótesis nula, concluyendo que nuestro modelo sí es válido.

REGRESIÓN POISSON

Planteemos la primera hipótesis:

HIPOTESIS 1: A nivel departamental, la cantidad de personas víctimas de trata está afectada por el porcentaje de habitantes de sexo femenino.

Resumen de Regresion Lineal
	OLS asegurados (I)
(Intercept)	-218.269
	(555.218)
MUJERES	5.178
	(11.104)
Num.Obs.	24
R2	0.010
R2 Adj.	-0.035
AIC	258.4
BIC	262.0
Log.Lik.	-126.212
F	0.217
RMSE	46.52
+ p < 0.1, * p < 0.05, p < 0.01, * p < 0.001

Regresiones OLS y Poisson
	OLS asegurados (I)	POISSON asegurados
(Intercept)	-218.269	-4.546*
	(555.218)	(1.950)
MUJERES	5.178	0.088*
	(11.104)	(0.039)
Num.Obs.	24	24
R2	0.010
R2 Adj.	-0.035
AIC	258.4	1046.7
BIC	262.0	1049.1
Log.Lik.	-126.212	-521.375
F	0.217	5.109
RMSE	46.52	47.41
+ p < 0.1, * p < 0.05, p < 0.01, * p < 0.001

HIPOTESIS 2: A nivel departamental, la cantidad de personas víctimas de trata está afectada por el porcentaje de habitantes de sexo femenino y el porcentaje de población inmigrante según departamento de nacimiento.

Regresiones Poisson anidadas
	POISSON asegurados (I)	POISSON asegurados (II)
(Intercept)	-4.546*	10.215***
	(1.950)	(1.903)
MUJERES	0.088*	-0.213***
	(0.039)	(0.038)
INMIGRANTES		0.046***
		(0.002)
Num.Obs.	24	22
AIC	1046.7	490.9
BIC	1049.1	494.1
Log.Lik.	-521.375	-242.437
F	5.109	371.083
RMSE	47.41	23.26
+ p < 0.1, * p < 0.05, p < 0.01, * p < 0.001

Regresión Poisson - coeficientes exponenciados
	POISSON asegurados (I)	POISSON asegurados (II)
(Intercept)	0.0106*	27309.5413***
	[0.0002199, 0.4599]	[619.8674, 1079309.4997]
MUJERES	1.0920*	0.8082***
	[1.0127790, 1.1797]	[ 0.7506, 0.8719]
INMIGRANTES		1.0473***
		[ 1.0436, 1.0509]
Num.Obs.	24	22
AIC	1046.7	490.9
BIC	1049.1	494.1
Log.Lik.	-521.375	-242.437
F	5.109	371.083
RMSE	47.41	23.26
+ p < 0.1, * p < 0.05, p < 0.01, * p < 0.001

EQUIDISPERSIÓN

Test de Equidispersión
	Es probable?
overdispersion	TRUE
underdispersion	FALSE

Regresiones Poisson y QuasiPoisson
	POISSON asegurados (II)	QUASIPOISSON asegurados (II)
(Intercept)	10.215***	10.215
	(1.903)	(8.332)
MUJERES	-0.213***	-0.213
	(0.038)	(0.167)
INMIGRANTES	0.046***	0.046***
	(0.002)	(0.008)
Num.Obs.	22	22
AIC	490.9
BIC	494.1
Log.Lik.	-242.437
F	371.083	19.360
RMSE	23.26	23.26
+ p < 0.1, * p < 0.05, p < 0.01, * p < 0.001

EXP() de la Regresión Quasi Poisson (II) para Interpretación
	QuasiPoisson asegurados (II) exponenciado
(Intercept)	27309.5413
	[0.0007246, 130243474281.698]
MUJERES	0.8082
	[0.5928418, 1.146]
INMIGRANTES	1.0473***
	[1.0308893, 1.063]
Num.Obs.	22
F	19.360
RMSE	23.26
+ p < 0.1, * p < 0.05, p < 0.01, * p < 0.001

BINOMIAL NEGATIVA

EXP() de la Regresiones Poisson, Quasi Poisson y Binomial Negativa
	Poisson asegurados (II)	QuasiPoisson asegurados (II)	Binomial Negativa asegurados (II)
(Intercept)	27309.5413***	27309.5413	9430.1452
	[619.8674, 1079309.4997]	[0.0007246, 130243474281.698]	[0.001113, 1597088869090.188]
MUJERES	0.8082***	0.8082	0.8255
	[ 0.7506, 0.8719]	[0.5928418, 1.146]	[0.565402, 1.137]
INMIGRANTES	1.0473***	1.0473***	1.0476**
	[ 1.0436, 1.0509]	[1.0308893, 1.063]	[1.019041, 1.093]
Num.Obs.	22	22	22
AIC	490.9		207.4
BIC	494.1		211.7
Log.Lik.	-242.437		-99.689
F	371.083	19.360	3.981
RMSE	23.26	23.26	23.38
+ p < 0.1, * p < 0.05, p < 0.01, * p < 0.001

CONCLUSIONES:

Por un lado, el porcentaje de asistencia a la educación secundaria es alto en la mayoría de los departamentos. Esto podría ser un factor que ayuda a explicar el número de víctimas de trata de personas, ya que los estudios han sugerido que la educación puede reducir la vulnerabilidad a la trata de personas.

Asimsimo, existe una gran similitud en la participación laboral de las mujeres entre los departamentos. Esto podría significar que la situación económica de las mujeres no tiene un impacto significativo en el número de víctimas de trata de personas. No obstante, los números de casos de violencia reportados en los CEM varían mucho entre los departamentos. Esto podría explicar en parte el número de víctimas de trata de personas, ya que las mujeres víctimas de violencia tienen un mayor riesgo de ser victimizadas por la trata.

De igual forma, existe una correlación significativa entre los números de casos de violencia reportados en los CEM y el número de víctimas de trata de personas. Esto sugiere que los CEM pueden ser una buena fuente de información para identificar víctimas de trata de personas y que están bien posicionados para proporcionar apoyo a las víctimas.

A partir de los datos obenidos,se realizará las respectivas modelaciones múltiples y simples. Aquí podríamos dividir las variables como que del tipo “DEMOGRAFICAS”, “ECONOMICAS”, etc., para poder realizar un analisis más completo. Se espera que las variables económicas no sean las únicas que justifiquen el aumento o disminución de la trata de personas por departamento.

Por otro lado, algunas conlusiones y sugerencias para la gestión y políticas públicas son las siguientes:

Debido a la gran variación entre los departamentos en los números de casos de violencia reportados en los CEM, se puede sugerir que se necesitan recursos específicos para gestionar y supervisar los CEM en los departamentos con mayor número de casos.

Aunque la correlación por poco no llega a ser significativa entre inmigración y trata de personas, puede ser útil crear políticas públicas que brinden apoyo especializado para inmigrantes y refugiados, incluyendo programas de prevención y apoyo para víctimas de trata.

Se supone que la población rural tiene más posibilidades de ser propensa a ser victimas de la trata de personas como consecuencia colateral del problema de la centralización, fuerza y alcance del estado para con dichas regiones.

Por eso, es importante reconocer la centralidad del estado en la investigación de la trata de personas y desarrollar políticas públicas que hagan hincapié en el estado como un actor clave para proteger a los ciudadanos y hacer más eficiente el sistema judicial. Ya que, el debilitamiento de la institucionalidad estatal y la carencia de eficacia judicial que sufren los países con débiles instituciones estatales, como es en el caso de Perú, puede obstaculizar la investigación y castigo de delitos de trata.

Por ello, se debe involucrar a las comunidades rurales en la prevención de la trata de personas. Proporcionar educación sobre los riesgos de la trata de personas y dar a los residentes de las áreas rurales las habilidades necesarias para evitar caer en trampas de trata.

Por último, es importante recordar que la trata de personas es un problema transnacional. Por lo que, es importante desarrollar asociaciones regionales para la prevención y el combate de la trata de personas. La cooperación internacional es fundamental para rastrear a los traficantes y proteger a las víctimas de trata de personas.

Analisis Factorial

                 MUJERES INMIGRANTES EMIGRANTES URBANO RURAL SOCIOECO_MUYBAJO
MUJERES             1.00        0.23       0.63  -0.20  0.20             0.02
INMIGRANTES         0.23        1.00       0.32   0.36 -0.36            -0.43
EMIGRANTES          0.63        0.32       1.00  -0.46  0.46             0.36
URBANO             -0.20        0.36      -0.46   1.00 -1.00            -0.89
RURAL               0.20       -0.36       0.46  -1.00  1.00             0.89
SOCIOECO_MUYBAJO    0.02       -0.43       0.36  -0.89  0.89             1.00
ASISTENCIA_SEC      0.19        0.15      -0.14   0.22 -0.22            -0.47
PEAOCUPADA_FEM      0.59       -0.20       0.55  -0.84  0.84             0.69
CASOSCEM            0.33        0.94       0.42   0.30 -0.30            -0.39
ASISTENCIA_SUP      0.00       -0.08      -0.34   0.16 -0.16            -0.38
VICTIMAS            0.07        0.87       0.28   0.38 -0.38            -0.38
                 ASISTENCIA_SEC PEAOCUPADA_FEM CASOSCEM ASISTENCIA_SUP VICTIMAS
MUJERES                    0.19           0.59     0.33           0.00     0.07
INMIGRANTES                0.15          -0.20     0.94          -0.08     0.87
EMIGRANTES                -0.14           0.55     0.42          -0.34     0.28
URBANO                     0.22          -0.84     0.30           0.16     0.38
RURAL                     -0.22           0.84    -0.30          -0.16    -0.38
SOCIOECO_MUYBAJO          -0.47           0.69    -0.39          -0.38    -0.38
ASISTENCIA_SEC             1.00          -0.02     0.21           0.75     0.15
PEAOCUPADA_FEM            -0.02           1.00    -0.07           0.01    -0.21
CASOSCEM                   0.21          -0.07     1.00           0.04     0.89
ASISTENCIA_SUP             0.75           0.01     0.04           1.00    -0.06
VICTIMAS                   0.15          -0.21     0.89          -0.06     1.00

Graficamos para ver las correlaciones

Kaiser-Meyer-Olkin factor adequacy
Call: psych::KMO(r = corMatrix)
Overall MSA =  0.67
MSA for each item = 
         MUJERES      INMIGRANTES       EMIGRANTES           URBANO 
            0.36             0.68             0.65             0.76 
           RURAL SOCIOECO_MUYBAJO   ASISTENCIA_SEC   PEAOCUPADA_FEM 
            0.76             0.90             0.60             0.65 
        CASOSCEM   ASISTENCIA_SUP         VICTIMAS 
            0.67             0.42             0.64

[1] FALSE

[1] TRUE

Parallel analysis suggests that the number of factors =  3  and the number of components =  NA


Loadings:
                 MR1    MR2   
MUJERES           0.348  0.437
INMIGRANTES      -0.209  0.896
EMIGRANTES        0.611  0.558
URBANO           -0.939  0.224
RURAL             0.939 -0.224
SOCIOECO_MUYBAJO  0.854 -0.325
ASISTENCIA_SEC   -0.271  0.176
PEAOCUPADA_FEM    0.872       
CASOSCEM         -0.130  0.989
ASISTENCIA_SUP   -0.266       
VICTIMAS         -0.241  0.812

                 MR1   MR2
SS loadings    4.013 3.185
Proportion Var 0.365 0.290
Cumulative Var 0.365 0.654

Mejoramos el resultado, ya que hay más de un factor


Loadings:
                 MR1    MR2   
MUJERES                       
INMIGRANTES              0.896
EMIGRANTES        0.611  0.558
URBANO           -0.939       
RURAL             0.939       
SOCIOECO_MUYBAJO  0.854       
ASISTENCIA_SEC                
PEAOCUPADA_FEM    0.872       
CASOSCEM                 0.989
ASISTENCIA_SUP                
VICTIMAS                 0.812

                 MR1   MR2
SS loadings    4.013 3.185
Proportion Var 0.365 0.290
Cumulative Var 0.365 0.654

Resultado visual

# Análisis cluster #### Distribución de las varaibles independientes

Cambiamos de sus rangos. Elejimos un rango del 0 al 1.

Otra estrategia sería tipificarla. Como se muestra a continuación:

Nos quedaremos con esta opción y veremos las correlaciones entre esas variables tipificadas.

                     MUJERES INMIGRANTES EMIGRANTES     URBANO      RURAL
MUJERES           1.00000000          NA  0.6437818 -0.1499779  0.1499779
INMIGRANTES               NA           1         NA         NA         NA
EMIGRANTES        0.64378178          NA  1.0000000 -0.4036391  0.4036391
URBANO           -0.14997795          NA -0.4036391  1.0000000 -1.0000000
RURAL             0.14997795          NA  0.4036391 -1.0000000  1.0000000
SOCIOECO_MUYBAJO          NA          NA         NA         NA         NA
ASISTENCIA_SEC    0.20740630          NA -0.1010285  0.2450254 -0.2450254
PEAOCUPADA_FEM    0.56212489          NA  0.5349694 -0.8346521  0.8346521
CASOSCEM          0.35201379          NA  0.4253796  0.3126874 -0.3126874
ASISTENCIA_SUP   -0.01376288          NA -0.3397866  0.1608940 -0.1608940
                 SOCIOECO_MUYBAJO ASISTENCIA_SEC PEAOCUPADA_FEM    CASOSCEM
MUJERES                        NA     0.20740630    0.562124886  0.35201379
INMIGRANTES                    NA             NA             NA          NA
EMIGRANTES                     NA    -0.10102847    0.534969415  0.42537963
URBANO                         NA     0.24502544   -0.834652144  0.31268744
RURAL                          NA    -0.24502544    0.834652144 -0.31268744
SOCIOECO_MUYBAJO                1             NA             NA          NA
ASISTENCIA_SEC                 NA     1.00000000   -0.029710731  0.21579718
PEAOCUPADA_FEM                 NA    -0.02971073    1.000000000 -0.06963989
CASOSCEM                       NA     0.21579718   -0.069639890  1.00000000
ASISTENCIA_SUP                 NA     0.73394982   -0.004608238  0.02839493
                 ASISTENCIA_SUP
MUJERES            -0.013762881
INMIGRANTES                  NA
EMIGRANTES         -0.339786642
URBANO              0.160893965
RURAL              -0.160893965
SOCIOECO_MUYBAJO             NA
ASISTENCIA_SEC      0.733949822
PEAOCUPADA_FEM     -0.004608238
CASOSCEM            0.028394931
ASISTENCIA_SUP      1.000000000

Como hay correlaciones negativas sería bueno invertir el rango…