Los datos pertenecen a Wooldridge Source: R.C. Fair (1978), “A Theory of Extramarital Affairs,” Journal of Political Economy 86, 45-61, 1978. Los información fue recolectada con el paquete de R llamado AER. El propósito es hacer un informe breve de los datos y una regresión que nos ayude a calcular la probabilidad de que una persona sea infiel dadas ciertas características.

¿Necesitas comunicarte? ->

Visita mi página web -> Click aquí

Descripción

Para comenzar el análisis, se visualiza una gráfica de barras con la cantidad de veces que una persona ha sido infiel en el eje ‘x’, mientras en el eje ‘y’ se gráfica el número de entrevistados que tienen esa característica, por ejemplo, hay 34 personas que confesaron ser infieles una ocasión, mientras 451 nunca lo an sido.

Infidelidad por género

En la siguiente gráfica se tiene una división por confesión de al menos una infidelidad y el porcentaje para hombres y mujeres. Se puede observar como 77% de las mujeres confesaron no tener una infidelidad comparado al 73% de los hombres.El porcentaje restante en ambos segmento declara no haber tenido una infidelidad.

Infidelidad por edad

La siguiente gráfica muestra en el eje ‘x’ la edad de las personas entrevistadas y en el eje ‘y’ el porcentaje de respuesta a si fueron infieles. Hay algunas diferencias en las edades, sin embargo, los segmentos de edad con más infidelidades son 17, 32 y 47 años. Al parecer, en el último segmento de edad (57 años) hay una menor proporción de infidelidades

Años de casados

En este segmento se muestra una gráfica del porcentaje de personas entrevistadas y los años de casados que tienen que con su pareja. Se puede visualizar que entre más pasan los años, el porcentaje de infidelidad aumenta. Hasta ahora, es un dato interesante ya que se puede encontrar un patrón. Al año de casados, las personas infieles representan 14%, sin embargo, a los 15 años, el porcentaje cambia a 30%

Religión

En esta situación, se muestra el porcentaje de personas entrevistadas y la puntuación que le dan a su relación con la religión. En esta situación, un valor de 1 significa que es poco comprometido y un valor de 5 que se encuentra comprometido. Se puede observar que entre más comprometida es la persona con la iglesia, parece reducir el porcentaje de infidelidad.

Rating

Finalmente, se describe la puntuación que la persona da a su relación, entendiendo que el número 1 es poco comprometido y 5 muy comprometido. Según esta escala, es claro que personas con poco compromiso cometen más infidelidades que personas muy comprometidas; la diferencia es de 50% contra 15%.

Modelo

Se utiliza una regresión logística para modelar los datos, en una primera instancia se ejecutan todas las variables independientes, sin embargo, no resultan ser significativas. En una segunda etapa se seleccionan únicamente la edad, religión, años de casados y rating, obteniendo variables significativas y que aportan información al modelo.

Los parámetros de la regresión, se pueden interpretar de la siguiente forma:

Dados los datos anteriores, se hace un ejemplo con dos personas ficticias; Luis y Maria.

Probabilidad de ser infiel según características
age religiousness yearsmarried rating name prob
32 3 8 2 Luis 43%
43 1 18 3 Maria 63%