Datos Categóricos
Introducción
El presente trabajo es una investigación estadística que se desarrolla con la finalidad de indagar y analizar los distintos ítems asignados en el curso Introducción al Análisis de Datos Categóricos, y así afianzar las metodologías dadas en el mismo para, de este modo, dar una solución eficiente para cada caso de estudio.
Por tanto, para cada punto asignado y posteriormente estudiado se realizó su respectivo marco muestral de acuerdo a las problemáticas planteadas, e igualmente de forma detallada se colocaron las descripciones de los experimentos realizados para los casos que se requerían.
Finalmente, por medio de este estudio, se pretende demostrar la importancia que tiene el estudio estadístico desde el planteamiento del problema, la recolección de la informacion y el análisis de los datos hasta el momento de la evaluación y aplicación de las metodologías estadísticas pertinentes, ya que se quiere mostrar que con un debido manejo de los datos en función de la información que se tiene disponible, se pueden obtener inferencias y llegar a obtener resultados bastantes interesantes para la resolución de dichos problemas.
Objetivo General
Hacer inferencia y dar solución, mediante técnicas estadísticas con la información recolectada, a cada caso de estudio asignado para dicho trabajo.
Objetivos Específicos
Analizar la información obtenida de nuestros expertos en los diversos casos de estudio.
Formular una interpretación de los resultados dados.
Aplicar las técnicas y metodologías estadísticas más adecuadas para los diversos casos de estudio y experimentos de este trabajo.
Utilizar el software estadístico R, y R-Studio para presentar de manera resumida la información mediante gráficos y tablas.
Implementar los conocimientos afianzados de Datos Categóricos en el desarrollo de la investigación.
Punto 01
Marco Muestral
Catación de Café
El café colombiano es apetecido por su sabor y es catalogado como uno de los mejores del mundo, para Colombia éste representa aproximadamente el 7,88% de sus exportaciones, que en los años 2019 y 2017 registraron sus máximos ingresos 7,2 y 7,5 billones de pesos colombianos respectivamente, sin embargo, ¿qué hace tan apetecido al café colombiano?
Los consumidores de este producto en todo el mundo buscan que sea de alta calidad, para esto se ha desarrollado la cata de café, este consiste en un análisis sensorial, en el que se examinan sus propiedades a través de los sentidos, lo cual permite apreciar y percibir las propiedades características del café, los estímulos gustativos, olfativos y visuales que se obtiene a través de la cata permite la evaluación de sus propiedades, compararlas y establecer preferencias, entonces, la cata del café se hace principalmente para comprar distintos cafés y determinar cual de ellos tiene las mejores propiedades, sin embargo, también puede hacerse sin intención de hacer ningún tipo de comparación, en este caso, no se trata de comprar sino de encontrar y detectar las características del café y determinar si este es de calidad, pero, ¿qué características tiene un buen café?
A la hora de catar un café, se busca que este tenga un aroma o fragancia dulce, floral, ácidos agradables, frutos secos, etc, jamás debe percibirse un aroma a goma, químico, cuero, plata o madera seca, también se busca un que el café tenga cuerpo, con el tacto de la boca y el paladar se perciben sensaciones que produce la densidad de la bebida y sus elementos, el cuerpo de un café puede ser cremoso, ligero, lleno o redonde, la crema que produce el café puede ser también un elemento muy importante a tener en cuenta esta debe ser densa y suave, por otra parte, se busca que el café tenga un sabor ácido o dulces, en función de estos puede ser de acidez brillante, suave, balanceante o de dulzura frutal, floral, achocolatada, almendrada, etc.
El sabor del café varía a medida que este avanza por el paladar, percibiendo primero los dulces, después los salados, y finalmente los ácidos y amargos, es importante considerar el retrogusto, éste es la sensación que se obtiene luego de haber bebido el café, muchos de ellos van variado a medida que son consumidos. El retrogusto puede ser corto, largo o persistente y de una intensidad delicada, aguda o brillante, por último, se toma en cuenta el color del café, dependiendo del grado de tostado de los granos, se encuentran diferentes tonalidades que van desde un marrón claro hasta casi negro, cuanto más tostado sea el grano el color del café será más oscuro.
Objetivo
- El objetivo de este experimento es demostrar si una persona acostumbrada a tomar café, sin educación en la cata de éste, es capaz de determinar cómo fue preparada dicha bebida.
Recolección de los datos
Para este experimento, se seleccionaron a 8 personas (4 hombres y 4 mujeres) a quieres se les indicó que se les iba a brindar dos tazas de café preparadas de distintas maneras
Manera 1: Se hierve un pocillo leche y se vierte en un pocillo, a ésta se le agregan una cucharada y media de café, y dos cucharadas de azúcar y se revuelve.
Manera 2: En una cafetera, se prepara una jarra de café, se vierte en el pocillo el café hasta llegar a las tres cuartas partes de su capacidad, se vierte leche caliente hasta llegar a llenar el pocillo y por último, se vierten dos cucharadas de azúcar y se revuelve.
Una vez explicado estos dos distintos procedimientos a los participantes, se les informa que no se les indicará de qué manera se preparó el café que ellos procederán a tomar, y que son ellos quienes deben indicar la forma en que éste fue hecho, adicional a ello, se les solicita a los participantes que deben enjuagarse con agua la boca antes de tomar la bebida, cuatro horas después, se les solicita de nuevo a cada uno de los participantes que se enjuaguen la boca para proceder a tomar la segunda bebida.
Datos Obtenidos
- Participante 1: Hombre, falla en la primera prueba y acierta en la segunda.
- Participante 2: Hombre, acierta en ambas pruebas.
- Participante 3: Hombre, falla en ambas pruebas.
- Participante 4: Hombre, acierta en la primera prueba y falla en la segunda.
- Participante 5: Mujer, acierta en ambas pruebas.
- Participante 6: Mujer, acierta en ambas pruebas.
- Participante 7: Mujer, falla en ambas pruebas.
- Participante 8: Mujer, acierta en la primera prueba y falla en la segunda.
Así, se procede a colocar esta información en las siguientes tablas, donde 0:No y 1:Sí:
Participante 1 (Hombre)
| Falla | Acierta | |
|---|---|---|
| Prueba 1 | 1 | 0 |
| Prueba 2 | 0 | 1 |
Participante 2 (Hombre)
| Falla | Acierta | |
|---|---|---|
| Prueba 1 | 0 | 1 |
| Prueba 2 | 0 | 1 |
Participante 3 (Hombre)
| Falla | Acierta | |
|---|---|---|
| Prueba 1 | 1 | 0 |
| Prueba 2 | 1 | 0 |
Participante 4 (Hombre)
| Falla | Acierta | |
|---|---|---|
| Prueba 1 | 0 | 1 |
| Prueba 2 | 1 | 0 |
Participante 5 (Mujer)
| Falla | Acierta | |
|---|---|---|
| Prueba 1 | 0 | 1 |
| Prueba 2 | 0 | 1 |
Participante 6 (Mujer)
| Falla | Acierta | |
|---|---|---|
| Prueba 1 | 0 | 1 |
| Prueba 2 | 0 | 1 |
Participante 7 (Mujer)
| Falla | Acierta | |
|---|---|---|
| Prueba 1 | 1 | 0 |
| Prueba 2 | 1 | 0 |
Participante 8 (Mujer)
| Falla | Acierta | |
|---|---|---|
| Prueba 1 | 0 | 1 |
| Prueba 2 | 1 | 0 |
De la información suministrada en las tablas anteriores, se deciden resumir en nuevas tablas de contingencia segmentadas por género, para así poder realizar el debido análisis estadístico. En ese orden de ideas, se obtiene lo siguiente:
Tabla de Contingencia - Hombres
| Hombres | Falla | Acierta | Total |
|---|---|---|---|
| Prueba 1 | 2 | 2 | 4 |
| Prueba 2 | 2 | 2 | 4 |
| Total | 4 | 4 | 8 |
De lo cual, se propone un modelo Producto-Binomial, ya que el tamaño \(n_1\) corresponde a la cantidad de hombres que se les asigna la prueba número 1, y por ende su probabilidad de éxito estaría representada por \(\pi_1\). Así mismo, la probabilidad de éxito \(\pi_2\) le corresponde la cantidad de hombres que se les asigna la prueba número 2, es decir, \(n_2\).
Así:
\(P(A=a, B=b)\) = \(\binom{n_1}{a}\) \(\pi_1^a (1-\pi_1)^{n_1-a}\) \(\binom{n_2}{b}\) \(\pi_2^b (1-\pi_2)^{n_2-b}\)
Por tanto, se debe verificar la siguiente Hipótesis nula \(H_0\):
\(H_0 = \pi_1 = \pi_2 = \pi\), donde bajo \(H_0\), se tiene:
\(P(A+B = a+b)\) = \(\binom{N}{a+b}\) \(\pi^{a+b} (1-\pi)^{n-a-b}\)
Nota: Lo anterior es debido a que a+b es un estadístico suficiente para el parámetro \(\pi\), sino no se podría considerar lo anterior mostrado.
Entonces, para probar \(H_0: \pi_1 = \pi_2\) vs. \(H_1: \pi_1 \ne \pi_2\) se rechaza \(H_0\) si a es suficientemente grande con respecto a b, dado a+b.
Luego, la prueba que se realiza para este problema es la prueba de la razón de verosimilitud:
\(L(\pi_1, \pi_2)\) = \(\pi_1^{a} (1-\pi_1)^{b}\) \(\pi_2^{c} (1-\pi_2)^{d}\)
Que bajo \(H_0\), se tiene:
\(L(\pi_1 = \pi_2 = \pi)\) = \(\pi^{a+c} (1-\pi)^{b+d}\)
Donde, se tiene que:
\(G^2 = -2log(\lambda)\) ~ \(\chi^2\)
Así, se obtienen los siguientes gráficos:
Gráfico de barras de Aciertos y Pruebas para Hombres
Donde se ven equivalentes ya que cada respuesta tiene el mismo valor, lo que significa que tienen el mismo peso, y probabilidad.
Mosaico de Tabla de Contingencia para Hombres
Para observar las proporciones que se presentaron en la tabla de contingencia para hombres, gráficamente se optó por este gráfico de mosaicos donde claramente se observa que para cada respuesta corresponde el 25% de la respuesta dada para cada proporción.
Gráfico de Pastel de falla y aciertos en las pruebas de Hombres
Este gráfico representa tal cual lo que se mencionó anteriormente, para cada falla y acierto en cada prueba tiene la misma probabilidad, 25%.
Luego, las tablas para marginales no son necesarias calcularlas ya que se encuentran 2 respuestas, para cada opción. Así, las proporciones por filas, serían las mismas que las proporciones por columnas.
Entonces la prueba de hipótesis para lo anterior, sería:
\(H_0: \pi_1 = \pi_2\) vs. \(H_1: \pi_1 \ne \pi_2\)
Donde se obtuvo un valor de \(G^2\) = 0 y un valor-p de 1, que indica que es un valor más grande que \(\alpha\) = 0.5, por lo cual no hay evidencia para rechazar \(H_0\). Por lo tanto se concluye que cada proporción es la misma con respecto a las respuestas en el experimento de los hombres.
Tabla de Contingencia - Mujeres
| Mujeres | Falla | Acierta | Total |
|---|---|---|---|
| Prueba 1 | 1 | 3 | 4 |
| Prueba 2 | 2 | 2 | 4 |
| Total | 3 | 5 | 8 |
Del cual, se propone un modelo Producto-Binomial, ya que el tamaño \(n_1\) corresponde a la cantidad de mujeres que se les asigna la prueba número 1, y por ende su probabilidad de éxito estaría representada por \(\pi_1\) . Así mismo, la probabilidad de éxito \(\pi_2\) le corresponde la cantidad de mujeres que se les asigna la prueba número 2, es decir, \(n_2\) .
Por tanto, se sigue el mismo procedimiento que ya se explicó con anterioridad, es decir, el que se usó para los hombres.
Gráfico de barras de Aciertos y Pruebas para Mujeres
Donde se nota que las pruebas de mujeres, junto con sus aciertos y fallas tienen una proporción diferente a la de los hombres, por lo cual se puede concluir que obtuvieron más aciertos que los hombres.
Mosaico de Tabla de Contingencia para Mujeres
Acá, mediante el gráfico de mosaicos se nota claramente que los aciertos para la prueba 1 fueron mayor que las fallas que obtuvieron las mujeres, y que en la segunda prueba se obtuvieron resultados 50-50 para dicho género.
Gráfico de Pastel de falla y aciertos en las pruebas de Mujeres
Este gráfico representa lo que se mencionó anteriormente, la mayor parte del pastel corresponde para las mujeres que, en efecto, acertaron en la prueba número 1.
Luego, las tablas marginales para las mujeres son las siguientes:
Tabla de contingencia para proporciones por filas
| Mujeres | Falla | Acierta |
|---|---|---|
| Prueba 1 | 0.25 | 0.75 |
| Prueba 2 | 0.50 | 0.50 |
De la cual, se observa que para la prueba 2 hay un porcentaje igual entre fallar y acertar, pero que en la prueba 1 las mujeres acertaron más.
Tabla de contingencia para proporciones por columnas
| Mujeres | Falla | Acierta |
|---|---|---|
| Prueba 1 | 0.33 | 0.6 |
| Prueba 2 | 0.67 | 0.4 |
Con la cual se puede observar que para la prueba 1 hay un mayor porcentaje en el acierto, pero para la prueba dos sucede lo contrario, el fallo predomina con un porcentaje de 67% en las mujeres.
Así la prueba de hipótesis para lo anterior, sería:
\(H_0: \pi_1 = \pi_2\) vs. \(H_1: \pi_1 \ne \pi_2\)
Donde se obtuvo un valor de \(G^2\) = 0.5412 aproximadamente y un valor-p de 0.462, que indica que es un valor menor que \(\alpha\) = 0.5, por lo cual hay evidencia para rechazar \(H_0\). Por lo tanto, se concluye que cada proporción es diferente con respecto a las respuestas en el experimento de los mujeres.
Así a modo general, se intuye que las mujeres acertaron más que los hombres con este experimento bajo las mismas condiciones según la evidencia estadística.
Punto 02
Marco Muestral
Calidad de Vida
La calidad de vida son una serie de condiciones que debe gozar un individuo para que este pueda satisfacer sus necesidades tanto materiales como emocionales, que no sólo le permita sobrevivir sino también que viva con comodidad, la calidad de vida abarca varios aspectos, estos puede ser subjetivos como por ejemplo la forma en que el individuo aprovecha su tiempo libre, o pueden también ser objetivos como por ejemplo que este disponga de una vivienda en buenas condiciones apropiadas, usualmente, la calidad de la vida de un individuo es medida por 5 aspectos los cuales son:
Bienestar físico: Hace referencia a la salud e integridad física de la persona, esto implica que dicha persona pueda tener acceso a hospitales de calidad, comida saludable y variada.
Bienestar material: Hace referencia a los niveles de ingresos y posesión de bienes, un sujeto debería ganar lo suficiente como para poder satisfacer sus necesidades básicas.
Bienestar social: Hace referencia a las relaciones interpersonales del individuo, esto implica que un individuo debería tener unos grupos de amigos y familiares saludables.
Bienestar emocional: Hace referencia a la salud mental, un individuo debería desarrollar de manera positiva su autoestima y mantener estabilidad mental.
Desarrollo personal: Hace referencia al cumplimiento de metas personales, un individuo debería tener a su disposición las herramientas que le permitan la realización de sus proyectos.
Una manera en que es posible medir la calidad de vida de un individuo es el índice de desarrollo humano, este es un indicador que mide los adelantos medios de un país en tres aspectos básicos del desarrollo humano la esperanza de vida, educación o ingreso per cápita.
Objetivo
- Medir el bienestar material de la calidad de vida de una población y demostrar la influencia que sobre este el desarrollo personal
Información Encuesta de vida
La Encuesta de calidad de vida 2007 presenta información sobre si en un hogar tienen vehículo particular (0: No y 1: Sí), si tienen motocicleta y si tienen algún negocio en la casa además del estrato. La información se presenta en la siguiente tabla. Realice un análisis descriptivo.
| Negocio en la casa | 0 | 1 | ||
|---|---|---|---|---|
| Estrato | VehíPar | Motocicletas | ||
| 1 | 0 | 0 | 1732 | 92 |
| 1 | 101 | 5 | ||
| 1 | 0 | 11 | 1 | |
| 1 | 1 | 0 | ||
| 2 | 0 | 0 | 5109 | 385 |
| 1 | 466 | 47 | ||
| 1 | 0 | 131 | 14 | |
| 1 | 30 | 5 | ||
| 3 | 0 | 0 | 3816 | 254 |
| 1 | 446 | 58 | ||
| 1 | 0 | 217 | 17 | |
| 1 | 35 | 7 | ||
| 4 | 0 | 0 | 1268 | 131 |
| 1 | 148 | 6 | ||
| 1 | 0 | 155 | 4 | |
| 1 | 31 | 2 | ||
| 5 | 0 | 0 | 94 | 3 |
| 1 | 6 | 1 | ||
| 1 | 0 | 919 | 50 | |
| 1 | 87 | 4 | ||
| 6 | 0 | 0 | 0 | 0 |
| 1 | 0 | 0 | ||
| 1 | 0 | 416 | 2 | |
| 1 | 31 | 3 |
Matriz de Dispersión, Histograma y Correlación
Se crea una matriz de dispersión con la información anterior con el fin de encontrar relaciones y buscar patrones:
Se observa una tendencia lineal entre los hogares que poseen negocio en sus casas y en los hogares que no, que de hecho en su distribución se nota un comportamiento similar, lo cual tiene sentido ya que a diferencia de las otras variables tiene respuestas distintas de O: No y 1: Sí, y es por eso que se nota una correlación alta (0.99). Por otro lado, las demás correlaciones entre las demás variables tienen valores de cero, que indica que no es posible determinar algún sentido de covariación entre las mismas. Sin embargo, lo anterior mencionado no determina que no exista una relación no lineal entre las variables. También, se observan correlaciones con valores negativos que indican que las dos variables se correlacionan en sentido inverso, es decir a valores altos de una de ellas, le pueden corresponder valores bajos de la otra, y viceversa, como sucede en los Estratos y los hogares que no tienen negocio (correlación de -0.23) que implica que a mayor Estrato tengan los hogares, menor es el número de negocios que posean dentro de ellas, o como sucede entre las variables que representan las Motocicletas del hogar y los hogares que sí tienen negocio dentro de sus casas, poseen una correlación de -0.37, que demuestra que las casas con negocio tienen menos motos en sus hogares. Y así sucesivamente, con las demás variables que poseen correlación negativa.
Ahora, aprovechando que la Encuesta de calidad de vida 2007 tiene una estratificación, se proceden a realizar gráficos de barra asociando distintas variables y agrupando por el estrato socioeconómico:
Motocicleta vs Negocio en el Hogar por Estrato Socioeconómico
Lo cual indica que en la mayoría de los hogares en donde hay negocios en sus casas, no tienen motocicletas, sobretodo en los estratos 2 y 3.
Motocicleta vs No hay Negocio en el Hogar por Estrato Socioeconómico
La gráfica anterior indica que en la mayoría de los hogares en donde no hay negocios en sus casas, no tienen motocicletas en sus hogares, y donde es más común esta situación es para los estratos 2 y 3.
Finalmente, esto quiere decir que los hogares que poseen motocicletas son pocos, sin importar si se discrimina por negocio en el hogar (si hay o no negocio en el hogar) ya que las distribuciones de las gráficas tienen un comportamiento parecido.
Se hace realiza el mismo procedimiento pero ahora analizando los hogares con vehículos particulares por Estrato:
Vehículo Particular vs Negocio en el Hogar por Estrato
Se concluye con la gráfica que la mayoría de los hogares en donde hay negocios en sus casas, no tienen vehículos particulares, sobretodo en los estratos 1, 2, 3 y 4, especialmente en el estrato 2 y 3.
Vehículo Particular vs No hay Negocio en el Hogar por Estrato
Del gráfico anterior se puede observar que en la mayoría de los hogares en donde no hay negocios en sus casas, tampoco tienen vehículos particulares en sus hogares, y en donde es más común ésto es para los estratos 2 y 3. y para los que sí poseen vehículo particular y o tienen negocio en sus casas lo lideran los hogares cuyo estrato son 5 y 6.
Por tanto, esto demuestra que los hogares que poseen vehículos particulares son pocos, sin importar si se discrimina por negocio en el hogar, ya que las distribuciones de las gráficas tienen un comportamiento bastante semejante.
Ahora se crea la siguiente tabla que contiene el Estrato, el tipo de vehículo (particular o motocicleta) que posee en el hogar y si hay o no negocio por familia.
| Negocio en la casa | 0 | 1 | |
|---|---|---|---|
| Estrato | Tipo de Vehículo | ||
| 1 | Ninguno | 1732 | 92 |
| Motocicleta | 101 | 5 | |
| Particular | 11 | 1 | |
| Ambos | 1 | 0 | |
| 2 | Ninguno | 5109 | 385 |
| Motocicleta | 466 | 47 | |
| Particular | 131 | 14 | |
| Ambos | 30 | 5 | |
| 3 | Ninguno | 3816 | 254 |
| Motocicleta | 446 | 58 | |
| Particular | 217 | 17 | |
| Ambos | 35 | 7 | |
| 4 | Ninguno | 1268 | 131 |
| Motocicleta | 148 | 6 | |
| Particular | 155 | 4 | |
| Ambos | 31 | 2 | |
| 5 | Ninguno | 94 | 3 |
| Motocicleta | 6 | 1 | |
| Particular | 919 | 50 | |
| Ambos | 87 | 4 | |
| 6 | Ninguno | 0 | 0 |
| Motocicleta | 0 | 0 | |
| Particular | 416 | 2 | |
| Ambos | 31 | 3 |
Dicha tabla se creó con la finalidad de ver si por tipo de vehículo existe alguna influencia en si hay negocio o no en las casas agrupados por Estrato socioeconómico.
Tipo de Vehículo vs Negocio en el Hogar por Estrato
Lo cual indica que pocos hogares (21 hogares en total) en donde hay negocios en sus casas tienen ambos tipos de vehículos (motocicleta y vehículo particular). La mayor proporción de hogares no poseen ninguno de los dos tipos de vehículos, siendo el estrato 2 el dominante. Los hogares que tienen motocicleta se concentran entre los estratos 2 y 3. Y los hogares que tienen negocio en sus casas y a su vez que sí poseen vehículos particulares se concentran en el estrato 5, ésto sin ignorar que los hogares de estrato 2 y 3 tienen también hogares con ambos tipos de vehículos.
Tipo de vehículo vs No hay Negocio en el Hogar por Estrato
Lo cual indica que pocos hogares en donde no hay negocios en sus casas tienen ambos tipos de vehículos (motocicleta y vehículo particular), sobretodo en el estrato 1 en el cual solamente un hogar tiene ambos. También, se observa que la mayor proporción de hogares no poseen ninguno de los dos tipos de vehículos, siendo el estrato 2 el dominante, seguido por los hogares de estrato 3. Los hogares que tienen motocicleta y que no tienen negocio en las mismas, se concentran entre los estratos 2 y 3, seguidos por los estratos 5 y 1, respectivamente. Luego, los hogares que no tienen negocio en sus casas y a su vez tienen vehículo particular se concentran en el estrato 5, seguido del estrato 6.
Finalmente, las gráficas anteriores indican que los hogares que poseen algún tipo de vehículo tienen una distribución semejante, sin importar si se discrimina por negocio en el hogar (si hay o no negocio en el hogar) y su estrato socioeconómico.
Punto 03
Marco Muestral
¿Qué es el Matrimonio?
A través de la historia, el matrimonio se ha convertido en la fuente generadora de la formación de nuevas familias, estos son dos fuertes conceptos que están estrechamente ligados entre sí, pero ¿qué es el matrimonio?, ¿qué es la familia?
La palabra matrimonio como denominación de la institución social y jurídica deriva de la práctica y el derecho romano, más sin embargo Joans Corominas señala en el Diccionario Etimológico de la Lengua Catalana, que el significado del concepto del matrimonio es el “Acto jurídico para consagrar la procreación materna”, el jurisconsulto romano del siglo III d.c. Modestino define el matrimonio como “La unión del marido, la mujer y de la comunidad de toda la vida, en una comunicación del derecho divino y humano”, el filoso Kant define el matrimonio como “la unión de dos personas de diferentes sexos para la posesión mutua, durante toda la vida de sus facultades sexuales”, desde el punto de vista sociológico, el autor Peter Murdock lo define como “un complejo de tres costumbres centradas en la relación existente entre una pareja de adultos sexualmente asociados dentro de la familia”.
El filósofo español Ángel Rodríguez sostiene que “La familia es una sociedad natural, ya que responde a una inclinación natural del individuo” mientras que San Agustín, por su parte, postulaba que “la familia es el vivero de la sociedad”, por su parte, René Ramos Pazos, señala que “en el sentido vulgar todavía se habla de familia para referirse a las personas que moran bajo un mismo techo, sometidas a la dirección y recursos del jefe de la casa”. Estos autores, procuran explicar que el matrimonio es la unión indisoluble o perpetua entre un hombre y una mujer que tiene como fines la procreación y educación de los hijos y el amor y ayuda mutua entre los cónyuges, siendo la familia el eje fundamental la sociedad, esto implica que la sociedad nace en la familia, a su vez la familia nace en el matrimonio, que en ella tiene fundamento originario. Con el paso del tiempo, el matrimonio como eje de la familia ha sufrido cambios fundamentales, sin embargo, su carácter de protección de la prole, los cónyuges y el patrimonio familiar aún se mantiene, sin la estabilidad del compromiso matrimonial no podría entenderse que una sociedad estuviera dispuesta a promover que la familia se construya sobre la base de un vínculo vulnerable y cuya estabilidad y perdurabilidad no sean garantizadas.
Objetivo
- Conocer la calidad de un matrimonio longevo pues se espera que una pareja que en lo personal y lo conyugal haya alcanzado sus metas y que tenga una buena relación de pareja, desee o piense en renovar sus votos matrimoniales.
Definición de Variables
- OBS: Hace referencia al número en que se guardó la información, es decir, la obs 1 hace referencia a la información obtenida de la pareja 1.
- HOM: Hace referencia a que este es el hombre de la pareja, tiene valor 1.
- EDADH: Hace referencia a la edad en años que tiene el hombre.
- ESCOLH: Hace referencia al grado de escolaridad del hombre (1: primaria terminada, 2: secundaria terminada, 3: educación superior (técnica, tecnología carrera profesional) terminada).
- INGH: Hace referencia a si el hombre habla inglés con fluidez (1: SI, O: NO).
- CASARH: Hace referencia a si el hombre se volvería a casar con la mujer con que está casado.
- MUJ: Hace referencia a que este es la mujer de la pareja, tiene valor 0.
- EDADM: Hace referencia a la edad en años que tiene la mujer.
- ESCOLM: Hace referencia al grado de escolaridad la mujer (1: primaria terminada, 2: secundaria terminada, 3: educación superior (técnica, tecnología carrera profesional) terminada.
- INGM: Hace referencia a si la mujer habla inglés con fluidez (1: SI, O: NO).
- CASARM: Hace referencia a si la mujer se volvería a casar con el hombre con que está casada.
- TPOCAS: Hace referencia al tiempo que llevan casados la pareja sentimental.
- NHIJOS: Hace referencia al número de hijos de la pareja sentimental.
Datos de las parejas sentimentales
Se observan las primeras diez observaciones de la tabla que contiene la información de 149 parejas sentimentales:
| OBS | HOM | EDADH | ESCOLH | INGH | CASARH | MUJ | EDADM |
|---|---|---|---|---|---|---|---|
| 1 | 1 | 50 | 1 | 1 | 1 | 0 | 48 |
| 2 | 1 | 62 | 2 | 1 | 1 | 0 | 59 |
| 3 | 1 | 44 | 2 | 1 | 1 | 0 | 44 |
| 4 | 1 | 44 | 3 | 1 | 0 | 0 | 23 |
| 5 | 1 | 33 | 2 | 1 | 1 | 0 | 37 |
| 6 | 1 | 37 | 2 | 1 | 1 | 0 | 29 |
| 7 | 1 | 36 | 3 | 1 | 1 | 0 | 34 |
| 8 | 1 | 64 | 1 | 1 | 1 | 0 | 58 |
| 9 | 1 | 60 | 1 | 1 | 1 | 0 | 57 |
| 10 | 1 | 39 | 2 | 1 | 1 | 0 | 34 |
| OBS | ESCOLM | INGM | CASARM | TPOCAS | NHIJOS |
|---|---|---|---|---|---|
| 1 | 3 | 1 | 1 | 28 | 2 |
| 2 | 2 | 0 | 1 | 38 | 5 |
| 3 | 2 | 0 | 1 | 22 | 3 |
| 4 | 2 | 1 | 0 | 1 | 1 |
| 5 | 2 | 1 | 1 | 5 | 1 |
| 6 | 1 | 1 | 1 | 2 | 1 |
| 7 | 3 | 0 | 1 | 3 | 0 |
| 8 | 1 | 0 | 1 | 44 | 4 |
| 9 | 1 | 0 | 0 | 33 | 4 |
| 10 | 2 | 0 | 1 | 10 | 2 |
Matriz de Dispersión
Se crea una matriz de dispersión con la información anterior con la finalidad de encontrar relaciones y buscar patrones entre las variables antes mencionadas:
Aunque visualmente se llegan a observar que para algún par de variables pueden existir patrones y correlaciones dadas las dispersiones presentadas, también es cierto que como son 13 variables entonces el gráfico puede ser un poco engañoso ya que no se puede observar a detalle cada comportamiento.
Es por eso que se procede a realizar una matriz de correlaciones:
Matriz de Correlaciones
La siguiente matriz cabe recalcar que está enumerada del 1 al 13 para cada variable en el orden de la tabla anterior, es decir, 1=OBS, 2=HOM, 3=EDADH, 4=ESCOLH, …, 13=NHIJOS.
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1.00 | NA | 0.03 | 0.23 | 0.11 | 0.00 | NA | 0.03 | 0.21 | 0.12 | 0.04 | 0.00 | -0.11 |
| 2 | NA | 1 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| 3 | 0.03 | NA | 1.00 | -0.26 | 0.04 | 0.03 | NA | 0.92 | -0.23 | -0.06 | 0.00 | 0.89 | 0.68 |
| 4 | 0.23 | NA | -0.26 | 1.00 | 0.20 | -0.12 | NA | -0.32 | 0.60 | 0.04 | 0.11 | -0.32 | -0.33 |
| 5 | 0.11 | NA | 0.04 | 0.20 | 1.00 | -0.11 | NA | -0.06 | 0.18 | -0.07 | 0.13 | 0.04 | 0.14 |
| 6 | 0.00 | NA | 0.03 | -0.12 | -0.11 | 1.00 | NA | 0.06 | -0.05 | 0.04 | 0.27 | 0.04 | 0.10 |
| 7 | NA | NA | NA | NA | NA | NA | 1 | NA | NA | NA | NA | NA | NA |
| 8 | 0.03 | NA | 0.92 | -0.32 | -0.06 | 0.06 | NA | 1.00 | -0.29 | 0.01 | 0.02 | 0.91 | 0.68 |
| 9 | 0.21 | NA | -0.23 | 0.60 | 0.18 | -0.05 | NA | -0.29 | 1.00 | 0.18 | 0.03 | -0.35 | -0.42 |
| 10 | 0.12 | NA | -0.06 | 0.04 | -0.07 | 0.04 | NA | 0.01 | 0.18 | 1.00 | -0.10 | -0.11 | -0.16 |
| 11 | 0.04 | NA | 0.00 | 0.11 | 0.13 | 0.27 | NA | 0.02 | 0.03 | -0.10 | 1.00 | 0.04 | 0.03 |
| 12 | 0.00 | NA | 0.89 | -0.32 | 0.04 | 0.04 | NA | 0.91 | -0.35 | -0.11 | 0.04 | 1.00 | 0.77 |
| 13 | -0.11 | NA | 0.68 | -0.33 | 0.14 | 0.10 | NA | 0.68 | -0.42 | -0.16 | 0.03 | 0.77 | 1.00 |
De lo cual es notorio que las variables Mujer y Hombre para dicha matriz poseen NA (Datos perdidos), pero no nos debemos alarmar por eso, ya que se debe tener presente que los Hombres tienen solamente el valor asignado de 1 y las mujeres tienen el valor de 0, así que por eso se ve dicho comportamiento.
De la matriz se debe resaltar que la correlación más alta (0.92) se encuentra entre las variables de la edad del hombre y de la mujer, lo cual indica claramente que las edades entre las parejas sentimentales son muy semejantes por cada par.
También, se observan correlaciones negativas, como lo es el caso de la edad de la mujer y su respectiva escolaridad (-0.29), lo cual da indicios de que se da una relación inversa, es decir, entre mayor es la edad de la mujer, menor es su escolaridad.
Además, las otras correlaciones altas fueron las presentadas por la correlación entre la edad del hombre y el tiempo que llevan casados (0.89), la edad del hombre y el número de hijos (0.68), el tiempo casados y el número de hijos que tienen las parejas (0.77) y por supuesto, la edad de las mujeres con el número de hijos que poseen (0.91).
Por lo cual siendo congruentes con lo anterior analizado, se deciden observar con detalle las relaciones que poseen las variables “EDADH”, “EDADM”, “TPOCAS”, “NHIJOS”.
Como el número de Hijos “NHIJOS” es la variable cuyos valores tienen menos variaciones en comparación de las edades y el tiempo que llevan casados las parejas sentimentales, se opta por que dicha variable sea el factor grupo o estratificación para dicho análisis estadístico. Así:
Número de Hijos vs Edad del Hombre
La gráfica claramente indica que la edad de los hombres influye en la cantidad de hijos poseen éstos. Se notan patrones semejantes entre los grupos de hombre que no tienen hijos y los que poseen entre 1 y 2 hijos (y siempre en incremento), demostrando que los comportamientos son similares y que entre la población más joven de parejas sentimentales es más común que tengan menos hijos o que incluso no tengan.
Para las personas mayores de 60 (en promedio) se nota visualmente que poseen la mayor cantidad de hijos y posiblemente es porque las costumbres o los métodos de planificación no eran comunes para la población mayor y son factores que, de hecho, pueden influir en ello, pero como en este estudio no se cuenta con dicha información, es una recomendación a tener para futuros caso de estudio de esta índole.
Número de Hijos vs Edad de la Mujer
Esta gráfica representa, como la anterior analizada, que la edad de las mujeres también influye en la cantidad de hijos poseen las mismas. Se notan patrones semejantes entre grupos de mujeres y siempre en incremento a medida que aumenta la edad, demostrando así que la población de mujeres mayores son las que poseen mayor cantidad de hijos.
Debido al comportamiento semejante al del número de hijos y edad de hombres se puede concluir además de que tienen distribuciones similares independiente de la edad, que dicho comportamiento también es gracias a que entre las edades de hombres y mujeres hay relación directa, que implícitamente demuestra que cada persona se empareja con personas que tienen un rango de edad muy similar.
Número de Hijos vs Tiempo de Casados
Finalmente, esta gráfica nos muestra una relación, dicha relación da indicios de que el tiempo que llevan casadas las parejas es directamente proporcional a las edades que poseen los hombres y las mujeres agrupadas por número de hijos. Entre mayor cantidad de hijos, mayor es el tiempo que las parejas están casadas, y además de ello las parejas cuyas relaciones son más duraderas son entre las parejas que poseen más años, independientemente del género.
Punto 04
Marco Muestral
Belleza Física
La belleza física es un tema mucho más complejo de lo parece y mucho más amplio de lo que se puede imaginar, científicos de diversas áreas han realizado análisis y estudios que buscan comprender mejor los procesos estéticos, así como las implicaciones que tiene la belleza física sobre las relaciones sociales, la ciencia ha identificado tres cualidades clave de la belleza: simetría, dimorfismo sexual y mediana.
Más allá de estos últimos, las preferencias son mucho más complejas de desentrañar puesto que están ligadas a la forma en que el cerebro procesa la información, las preferencias estéticas tienen rasgos en común que trascienden el aspecto cultural e histórico, incluso los bebes prefieren rostros que los adultos han juzgado como bellos.
En el cerebro se producen una serie de reacciones cuando se observa algo bello sea un persona, un lugar o un objeto, así mismo cuando se observa algo que carece de belleza. Los estudios sugieren que las caras atractivas iluminan la red cerebral relacionada con la recompensa la cual no es una región neuronal en específico, por el contrario, se presenta una actividad neuronal compleja y distribuida a lo largo del cerebro, igual que cuando el individuo tiene sexo o consumo sustancias alucinógenas, por otra parte, cuando se observa algo que carece de belleza se activa la amígala, muy parecido a cuando el individuo siente miedo o surgen señales de alerta.
Es importante resaltar que la belleza física ha tenido un aspecto fundamental en los aspectos sociales, así como en el arte y la ciencia, ¿qué hizo propenso a los humanos a realizar obras de arte o hermosa arquitectura?, la belleza ha movido a la humanidad, en lo que respecta a la belleza física de los humanos, se ha vuelto un tema esencial para comprender los sesgos subconscientes sobre todo en procesos sociales cada vez más complejos, por ejemplo, los estudios demuestras que a personas que se les considera atractivas se es atribuye que son más confiables y buenas personas que a quienes no se les considera atractivos, esto aplica para candidatos políticos, acusados de algún delito o aspirantes a un empleo, así que es de suma importancia reconocer y saber las influencias subconscientes.
Objetivo
- Mostrar cómo la percepción de belleza al ver la fotografía del rostro de una persona puede cambiar cuando un observador considera que dicho rostro es más o menos simétrico.
Definición del experimento
Se recolectó una fotografía de cincuenta sujetos de manera individual (veinticinco hombres y veinticinco mujeres), dichas fotografías de tipo documento de identificación. Se buscó que cada individuo seleccionado fuera colombiano y en lo posible nacido en el departamento antioqueño, esto con el fin de que la muestra fuera lo más homogénea posible, posterior a esto, se seleccionaron diez sujetos más (cinco hombres y cinco mujeres), a cada uno de ellos se les mostró cada fotografía y debían calificar a cada individuo como “Atractivo o No Atractivo”, dependiendo del género del calificador, se le presentó el orden las fotografías, es decir, a los hombres se les presentó primero las fotografías de los hombres mientras que a las mujeres, se les presentó primero las fotografías de las mujeres.
Información obtenida
Se procede a mostrar la información recopilada en las siguientes tablas de contingencia, donde cada tabla representa los resultados que se obtuvieron para cada sujeto evaluador:
Sujeto 1 (Mujer)
| Fotografía Mujer | Fotografía Hombre | Total | |
|---|---|---|---|
| Atractivo | 8 | 5 | 13 |
| No Atractivo | 17 | 20 | 37 |
| Total | 25 | 25 | 50 |
Sujeto 2 (Hombre)
| Fotografía Hombre | Fotografía Mujer | Total | |
|---|---|---|---|
| Atractivo | 3 | 10 | 13 |
| No Atractivo | 22 | 15 | 37 |
| Total | 25 | 25 | 50 |
Sujeto 3 (Hombre)
| Fotografía Hombre | Fotografía Mujer | Total | |
|---|---|---|---|
| Atractivo | 8 | 5 | 13 |
| No Atractivo | 17 | 20 | 37 |
| Total | 25 | 25 | 50 |
Sujeto 4 (Mujer)
| Fotografía Mujer | Fotografía Hombre | Total | |
|---|---|---|---|
| Atractivo | 4 | 1 | 5 |
| No Atractivo | 21 | 24 | 45 |
| Total | 25 | 25 | 50 |
Sujeto 5 (Mujer)
| Fotografía Mujer | Fotografía Hombre | Total | |
|---|---|---|---|
| Atractivo | 19 | 6 | 25 |
| No Atractivo | 6 | 19 | 25 |
| Total | 25 | 25 | 50 |
Sujeto 6 (Hombre)
| Fotografía Hombre | Fotografía Mujer | Total | |
|---|---|---|---|
| Atractivo | 3 | 16 | 19 |
| No Atractivo | 22 | 9 | 31 |
| Total | 25 | 25 | 50 |
Sujeto 7 (Mujer)
| Fotografía Mujer | Fotografía Hombre | Total | |
|---|---|---|---|
| Atractivo | 6 | 0 | 6 |
| No Atractivo | 19 | 25 | 44 |
| Total | 25 | 25 | 50 |
Sujeto 8 (Hombre)
| Fotografía Hombre | Fotografía Mujer | Total | |
|---|---|---|---|
| Atractivo | 4 | 16 | 20 |
| No Atractivo | 21 | 9 | 30 |
| Total | 25 | 25 | 50 |
Sujeto 9 (Hombre)
| Fotografía Hombre | Fotografía Mujer | Total | |
|---|---|---|---|
| Atractivo | 5 | 6 | 11 |
| No Atractivo | 20 | 19 | 39 |
| Total | 25 | 25 | 50 |
Sujeto 10 (Mujer)
| Fotografía Mujer | Fotografía Hombre | Total | |
|---|---|---|---|
| Atractivo | 4 | 1 | 5 |
| No Atractivo | 21 | 24 | 45 |
| Total | 25 | 25 | 50 |
Se decide clasificar las tablas de contingencia, discriminando por género, para así observar si hay alguna influencia del género en la percepción de si una persona es atractiva o no lo es.
Tabla de Contingencia - Hombres
| Hombres | Fotografía Hombre | Fotografía Mujer | Total |
|---|---|---|---|
| Atractivo | 23 | 53 | 76 |
| No Atractivo | 102 | 72 | 174 |
| Total | 125 | 125 | 250 |
De lo cual, se propone un modelo Producto-Binomial, como en el Punto 01, y con las mismas especificaciones y estadístico de prueba.
Por tanto, se procede a obtener los siguientes gráficos:
Gráfico de barras de Fotografía y Belleza para Hombres
Donde se ve que para cada respuesta dada existen valores muy dispersos, lo que significa que las respuestas poseen diferentes proporciones, y probabilidad. Por lo cual se decide ver las proporciones de manera gráfica por medio del gráfico de mosaicos.
Mosaico de Tabla de Contingencia para Hombres
En donde se nota claramente que para los hombres las fotografías de hombres la gran proporción pertenecen a la clasificación de no atractivos, mientras que estos mismos hombres consideran que la mayoría de las fotografías de las mujeres son atractivas.
Gráfico de Pastel de Fotografía y Belleza en las pruebas de Hombres
Este gráfico representa tal cual lo que se mencionó anteriormente, la gran parte del pastel pertenece a los hombres no atractivos, seguido de la proporción de mujeres no atractivas, según los hombres. Y entre la población de atractivos, es menor los hombres atractivos que la población de mujeres atractivas, según los hombres del experimento.
Luego, las tablas para marginales son las siguientes:
Tabla de contingencia para proporciones por filas
| Hombres | Fotografía Hombre | Fotografía Mujer |
|---|---|---|
| Atractivo | 0.3026 | 0.6974 |
| No Atractivo | 0.5862 | 0.4138 |
De la cual, se observa que para la Fotografía Mujer hay un mayor porcentaje 69.7% en cuanto a ser consideradas atractivas, y quien no goza de esos mismos resultados son el porcentaje de hombres atractivos que tiene un 30.3%.
Tabla de contingencia para proporciones por columnas
| Hombres | Fotografía Hombre | Fotografía Mujer |
|---|---|---|
| Atractivo | 0.184 | 0.424 |
| No Atractivo | 0.816 | 0.576 |
Con la cual se puede observar que el mayor porcentaje corresponde a los hombres no atractivos, y el más bajocon un porcentaje de 18.4% para los hombres considerados atractivos.
Entonces la prueba de hipótesis para lo anterior, sería:
\(H_0: \pi_1 = \pi_2\) vs. \(H_1: \pi_1 \ne \pi_2\)
Donde se obtuvo un valor de \(G^2\) = 17.36893 y un valor-p de 3.078169e-05, que indica que es un valor más pequeño que \(\alpha\) = 0.5, por lo cual hay evidencia para rechazar \(H_0\). Por lo tanto, se concluye que cada proporción es diferente con respecto a las respuestas dadas en el experimento de los hombres con su indicador de belleza.
Tabla de Contingencia - Mujeres
| Mujeres | Fotografía Mujer | Fotografía Hombre | Total |
|---|---|---|---|
| Atractivo | 41 | 13 | 54 |
| No Atractivo | 84 | 112 | 196 |
| Total | 125 | 125 | 250 |
Del cual, se propone el mismo modelo que para el caso de los hombres, con sus respectivas especificacioes ya mencionadas en el inciso del Punto 01.
Por tanto, continúa con el mismo procedimiento que se usó para el análisis de los hombres.
Por tanto, se procede a obtener los siguientes gráficos:
Gráfico de barras de Fotografía y Belleza para Mujeres
Donde se ve que para cada respuesta dada existen valores diferentes, lo que significa que las respuestas poseen diferentes proporciones, y posiblemente distinta probabilidad. Por lo cual se decide ver dichas proporciones por medio de un gráfico de mosaicos.
Mosaico de Tabla de Contingencia para Mujeres
En donde se nota claramente que para las mujeres las fotografías de hombres la gran proporción pertenecen a la clasificación de no atractivos, mientras que estas mismas mujeres consideran que la mayoría de las fotografías de las mujeres son atractivas.
Este mismo fenómeno ocurrió cuando se analizó la percepción de belleza por parte de los hombres. Así que ésto da indicios de que independientemente del género las fotografías de los hombres su mayor porcentaje serán considerados como no atractivos.
Gráfico de Pastel de Fotografía y Belleza en las pruebas de Mujeres
Este gráfico representa tal cual lo que se comentó con anterioridad, la gran parte del pastel pertenece a los hombres no atractivos, seguido de la proporción de mujeres no atractivas, según las mujeres. Y entre la población de atractivos, es menor la proporción que corresponde a los hombres atractivos que la población de mujeres atractivas, según los mujeres de dicho experimento.
Luego, las tablas para marginales son las siguientes:
Tabla de contingencia para proporciones por filas
| Mujeres | Fotografía Mujer | Fotografía Hombre |
|---|---|---|
| Atractivo | 0.76 | 0.24 |
| No Atractivo | 0.43 | 0.57 |
De la cual, se observa que para la Fotografía Mujer hay un mayor porcentaje (76% aproximadamente) en cuanto a ser consideradas atractivas, caso contrario a los hombres atractivos que poseen un 24% aproximado, siendo el porcentaje más bajo de todos.
Tabla de contingencia para proporciones por columnas
| Mujeres | Fotografía Mujer | Fotografía Hombre |
|---|---|---|
| Atractivo | 0.33 | 0.10 |
| No Atractivo | 0.67 | 0.9 |
Con la cual se puede observar que el mayor porcentaje corresponde a los hombres no atractivos (90% aproximado), y el más bajo con un porcentaje de 10% para los hombres considerados atractivos.
Luego, la prueba de hipótesis para el problema anterior, sería:
\(H_0: \pi_1 = \pi_2\) vs. \(H_1: \pi_1 \ne \pi_2\)
Donde se obtuvo un valor de \(G^2\) = 19.26493 y un valor-p de 1.137772e-05, que indica que es un valor más pequeño que \(\alpha\) = 0.5, por lo cual hay evidencia para rechazar \(H_0\). Por lo tanto, se concluye que cada proporción es diferente con respecto a las respuestas dadas en el experimento de las mujeres con su indicador de belleza.
Esto indica que estadísticamente hablando, indepedientemente de si son hombres o mujeres los sujetos que se encuestaron en este experimento, se inclinan a considerar que la mayor proporción de hombres son no atractivos.
Conclusiones Generales
Se considera que de manera eficiente se realizó un estudio estadístico implementando lo afianzado en la asignatura de Datos Categóricos.
El diseño de experimento y la recolección de datos fueron eficientes y efectivos para el progreso y la resolución de los diversos casos de estudio.
Los análisis y metodologías realizadas para cada caso, hicieron que se comprendiera de mejor forma los métodos que nos brinda propiamente el estudio de los datos categóricos.
Comentarios
Es recomendable que estos casos de estudio se planteen con un tamaño de muestra más grande para así obtener resultados más cercanos a la realidad.
Las herramientas virtuales jugaron un papel fundamental (R, R-Studio y WhatsApp) para culminar dicha investigación, es por eso que se debe resaltar la importancia de saber aprovechar las ventajas que brinda el estar en la Era Digital.
Bibliografía
C, Juan. (2022). Notas de clase Datos Categóricos. Semestre 2022. Universidad Nacional de Colombia. Sede Medellín.
Comunidad Coffee Life. (2017). ¿QUÉ ES UNA CATA DE CAFÉ?. Coffee Life. Obtenido de https://www.coffeelife.es/blog/cata-cafe
Equipo de redactores Legis. (16 de febrero de 2022). Los principales productos que exporta Colombia. Legis. Obtenido de https://blog.legis.com.co/comercio-exterior/principales-productos-que-exporta-colombia
Lara, V. (11 de marzo de 2021, última actualización). La importancia de la belleza según la ciencia. Hipertextual. Obtenido de https://hipertextual.com/2015/10/belleza-ciencia
Vivanco, L. y Vivanco K. (2013). Análisis de la evolución del matrimonio a través del tiempo.