EL presente trabajo analiza el comportamiento de consumo en la población fumadora de una universidad en la ciudad de Cali, se partió de una muestra de 50 estudiantes de la universidad, a los resultados obtenidos se ha aplicado estadística descriptiva, de esta se han obtenido supuestos, que posteriormente han sido estudiado con prueba de hipótesis de proporción, media y diferencia de media para comprobar su validez, así mismo, hemos aplicado intervalos de confianza sobre media y varianza sobre las principales variables a estudiar, en adición se han aplicado pruebas de normalidad, junto análisis de modelos de regresión lineal con fines académicos.
Hoy en día la población fumadora no se asocia únicamente al tabaquismo clásico con el consumo de cigarrillos, un nuevo producto se ha masificado, indexándose al catálogo de la nicotina, este es el vapeador, siendo predominante su consumo en los jóvenes, facilitando su consumo debido a la carencia de encendedores y gusto fuerte brindado por el tabaco.
Cómo estudiantes universitarios, vemos de primera mano el aumento del consumo de nicotina por este método, junto al consumo de otras sustancias a través de la inhalación de humo, por el aumento del consumo y el contexto en el que nos encontramos hemos optado por investigar esta problemática en nuestra universidad, recopilando datos del hábito de consumo y la población universitaria que consume esta clase de sustancias.
Identificar la población fumadora en estudiantes de pregrado en una universidad de la ciudad Cali en el Semestre 2023-1 a través de entrevistas, estableciendo sus hábitos de consumo, agrupando los datos por género masculino y femenino con el fin de estudiar las diferencias entre estos grupos.
Para la recolección de datos se han encuestado a 50 personas de una universidad de Cali, realizando las siguientes preguntas:
La población entrevistada se compone de 27 hombres y 23 mujeres, y aunque existe una leve diferencia del 8% (4 personas) se puede inferir que la distribución de género es casi un cincuenta cincuenta.Con el gráfico de dispersión de edad con respecto al género se puede concluir que los datos edad recolectados del género femenino poseen un sesgo negativo, a diferencia de los datos del género masculino con un sesgo positivo, así mismo en promedio, las mujeres entrevistas se diferencian de los hombres al ser un año menor (sin considerar datos atípicos).
A través de los indicadores de tendencia central y un análisis gráfico se puede determinar que la tendencia de los datos de la población general se dirige a los 19 años, de este modo se puede afirmar que la mayoría de la población entrevistada tiene esta edad. Por otra parte, se observa que el rango de edad de los encuestados es de 16 a 30 años, con un promedio de 19,68 años y una desviación de 2,13 años. El estudiante de mayor edad pertenece a la facultad de Ingeniería. Como lo muestra el diagrama de caja y bigote, se confirma que los datos presentan un sesgo positivo siendo el coeficiente de Pearson > 0, con la mayoría de los datos posicionados en 19 años, las edades de 30 y 36 años son considerados datos atípicos.
Coeficiente asimetría de Pearson:
## [1] 0.898701
## Valor
## Media 19.680000
## Desviacion 2.132738
Intervalos de confianza Edad:
## Intervalo de confianza para la media ( 95 %): [ 19.08885 , 20.27115 ]
## Intervalo de confianza para la varianza ( 95 %): [ 3.173915 , 7.063242 ]
El intervalo de confianza para las medias de edad nos refleja que la media esta entre 19 y 20 años, con una confianza del 95% lo cual es bastante preciso en este caso.
El intervalo de confianza para la varianza Esta entre 3,1739-7,0632 con un nivel de confianza del 95% para asegurarnos donde se podría encontrar la medida de dispersión de los datos.
Podemos apreciar que la mediana de edades de la muestra es mayor en los hombres que en las mujeres. La mediana de los hombres tiende más hacia los 20 años, mientras que la de las mujeres hacia los 19 años. En cuanto a la desviación estándar, para las mujeres, aunque su media es menor, tiene una desviación de 2.57, siendo una muestra más heterogénea que la de los hombres, la cual tiene una desviación de 1.69.
Mujeres:
## Valor
## Media 19.391304
## Desviacion 2.571507
Intervalos de confianza Edad Mujeres:
## Intervalo de confianza para la media ( 95 %): [ 18.2793 , 20.50331 ]
## Intervalo de confianza para la varianza ( 95 %): [ 3.955287 , 13.24659 ]
El intervalo de confianza de la media para la edad de mujeres nos muestra con una fiabilidad del 95% que la media de edad se encuentra entre 18 y 20 años, bastante acertada para un rango de 7 años.
El intervalo de confianza para la varianza de edad en mujeres con fiabilidad del 95% esta entre 3,9552-13,2465, siendo este mayor ya que el rango de edades entre mujeres fumadoras es de 13 años.
Hombres:
## Valor
## Media 19.925926
## Desviacion 1.685365
Intervalos de confianza Edad Hombres:
## Intervalo de confianza para la media ( 95 %): [ 19.25922 , 20.59263 ]
## Intervalo de confianza para la varianza ( 95 %): [ 1.7616 , 5.334611 ]
El intervalo de confianza para la media de edad en los hombres es de 19 a 20 años, el cual teniendo en cuenta la variable edad es muy acertado, también teniendo en cuenta su nivel de significancía del 95%.
El intervalo de confianza para la varianza de edad en hombres esta entre 1,7616-5,3346 con un nivel de significancía del 95%, siendo este menor, pues en los hombres los datos se dispersan solo en un rango de 7 años.
## Mujeres Hombres
## Mujeres 1.00 -0.56
## Hombres -0.56 1.00
## [1] -0.5642581
Podemos apreciar que las edades de hombres y mujeres presentan un coeficiente de correlación de -0.5642501. Por lo cual podemos interpretar que las variables se mueven en un leve sentido inverso, sin embargo sigue estando cerca de 0.
Como lo muestra el gráfico de barras la facultad de ciencias económicas y administrativas tiene una supremacía sobre el resto con amplia diferencia, es la moda. El resto de encuestados se reparten de una manera mas o menos uniforme en el resto de facultades, exceptuando la facultad de creación y hábitat (3 estudiantes).
Mediante el análisis gráfico se puede determinar que; la facultad de ciencias económicas y administrativas tiene datos simétricos y un dos datos atípicos (22 y 23 años). La facultad de ciencias de la salud tiene un marcado sesgo positivo, la población entrevistada de esta facultad tiende a tener una edad menor o igual a 19 años. La facultad de creación y habitad por el contrario a la de ciencias de la salud muestra un marcado sesgo positivo y gran concentración entre los 18 y 19 años. La facultad de humanidades y ciencias sociales, cuenta con datos simétricos y un promedio de 19 años en la población encuestada. Por ultimo la facultad de ingenierías muestra un sesgo positivo en cuento a sus edades, con un promedio de 21 años, también cuenta con un dato atípico (30 años).
Mediana:
## C.Eco.Adm. C.Salud Cre.Hab. Hum.C.Soc. Ing.C.
## 19 19 18 19 21
##
## C.Eco.Adm. C.Salud Cre.Hab. Hum.C.Soc. Ing.C.
## Hombre 11 3 1 5 7
## Mujer 8 4 2 4 5
Como podemos apreciar, ambos sexos están distribuidos de una manera muy similar entre las facultades, teniendo ambos como moda la facultad de ciencias económicas y administrativas, y la facultad de creación y hábitat como la menos poblada.
Como el gráfico lo muestra hay una distribución perfectamente simétrica de cincuenta a cincuenta en cuento al interés por fumar de la población encuestada. Como lo indican ambos diagramas, el promedio de edad tanto para el Si como para el No es de 19 años. El diagrama de caja y bigotes del Si muestra un claro sesgo positivo. El diagrama del No cuenta con un sesgo positivo, sin embargo cuenta con un rango intercuartílico mas amplio.
Mediana:
## No Si
## 19 19
En cuanto a la proporción del interés por fumar de ambos sexos, observamos una notable diferencia. Más del 70 % de las mujeres de la muestra no están interesadas en fumar, mientras que para los hombres es lo contrario, más del 70 % sí está interesado en fumar.
Como el gráfico lo indica más de la mitad de la población encuestada fuma, se presencia una contradicción entre el interés y estado de fumar, debido a que 3 personas, no se interesan en fumar, pero fuman, justificadas en posiblemente una errónea respuesta al momento de la encuesta o una cuestión de perspectiva frente al análisis de la pregunta. La dispersión de edad de la población fumadora como no fumadora tiene un sesgo positivo. El rango intercuartílico de la población fumadores es mas corto que el de la población no fumadora, la mayoría de fumadores están entre los 18 y 20 años.
Mediana dispersión:
## No Sí
## 19 19
Intervalos de confianza proporción fumadores:
## Intervalo de confianza para la proporción de fumadores ( 95 %): [ 0.3664451 , 0.6335549 ]
El intervalo de confianza que evidencia la proporción de fumadores con un nivel de confianza del 95% nos muestra que esta entre 0,3664-0,6335, el cual muestra una tendencia a estar cerca del 50% tanto en el limite inferior como superior, muy parecido a los datos obtenidos de la muestra con una proporción fumadora del 56%.
En las facultades de ciencias económicas y administrativas, creación y habitad, humanidades y ciencias sociales, la población fumadores es el doble o más de la no fumadora. Para la facultad de ingenierías y ciencias de la salud la población no fumadores predomina sobre la fumadora, mostrando una relación frente a la mayor cantidad de encuestados y fumadores en la facultad de economía.
Podemos apreciar que entre las mujeres la moda es no fumar, teniendo que son casi el doble las que no fuman sobre las que fuman. En cuanto a la muestra de hombres, los fumadores son dominantes sobre los no fumadores, teniendo una proporción de casi 3 a 1.
Intervalos de confianza proporción Mujeres fumadoras:
## Intervalo de confianza para la proporción de Mujeres fumadores ( 95 %): [ 0.1718958 , 0.5717885 ]
El intervalo de proporción de mujeres fumadoras esta entre 0,1718-0,5717 con un nivel de confiabilidad del 95% muestra una inclinación hacia una moda de una minoría fumadora.
Intervalos de confianza proporción Hombres fumadores:
## Intervalo de confianza para la proporción de Hombres fumadores ( 95 %): [ 0.5340628 , 0.8812706 ]
El intervalo de proporción de hombres fumadores esta entre 0,5340-0,8812 el cual muestra una tendencia a una mayoría fumadora, a diferencia de las mujeres.
Intervalos de confianza diferencia de proporciones:
## Diferencia de proporciones: 0.3929147
## Intervalo de confianza al 95%: 0.137551 0.6482783
Para la diferencia de proporciones con un nivel de fiabilidad del 95% se nos arroja un intervalo de 0,1375-0,6482 el cual tiene una mayor inclinación a sugerir que las proporciones entre ambos sexos varian bastante, siendo el comportamiento de estas dos variables distinto.
Como el gráfico de barras lo indica la moda es 15 años, la mayoría de entrevistados fumadores empezó a fumar a esta edad, se observa un sesgo positivo.Como lo podemos apreciar el rango intercuartílico esta entre 15 y 16 años (la mayoría de fumadores iniciaron en ese rango de edad), hay dos datos atípicos, 13 y 19 años.
## Valor
## Media 19.321429
## Desviacion 1.492042
Intervalos de confianza Edad en que empezó a fumar:
## Intervalo de confianza para la media ( 95 %): [ 15.26227 , 16.09487 ]
## Intervalo de confianza para la varianza ( 95 %): [ 0.7896175 , 2.340372 ]
El intervalo de confianza para la media sobre la edad en que se empezó a fumar esta entre los 15 y 16 años, teniendo un nivel de fiabilidad del 95% mostrando una fuerte tendencia de la muestra escogida por estas dos edades.
Respecto a la edad en que empezaron a fumar las mujeres, la moda es los 15 años. En comparación con la edad a la cual empezaron a fumar los hombres, cambia un poco, puesto que es una población mayor. En este caso, la moda es los 16 años, lo cual sigue siendo muy cercano a las mujeres.
Mujeres:
## Valor
## Media 18.8750000
## Desviacion 0.9910312
Intervalos de confianza Edad en que empezó a fumar Mujeres:
## Intervalo de confianza para la media ( 95 %): [ 14.99017 , 16.25983 ]
## Intervalo de confianza para la varianza ( 95 %): [ 0.3668948 , 3.4766 ]
Media: con un nivel de confianza del 95% se puede afirmar que la media se encuentra entre 14, 99 y 16,26 (Años) un rango de 1,27 años
Varianza: con un nivel de confianza del 95% se puede afirmar que la varianza se encuentra entre 0,37 y 3,48 un rango de 3,11
Hombres:
## Valor
## Media 19.500000
## Desviacion 1.638356
Intervalos de confianza Edad en que empezó a fumar Hombres:
## Intervalo de confianza para la media ( 95 %): [ 15.16607 , 16.23393 ]
## Intervalo de confianza para la varianza ( 95 %): [ 0.8583867 , 3.166221 ]
Media: con un nivel de confianza del 95% se puede afirmar que la media se encuentra entre 15,17 y 16,23 (Años) un rango de 1,06 años
Varianza: con un nivel de confianza del 95% se puede afirmar que la varianza se encuentra entre 0,86 y 3,17 un rango de 2,31
Como el gráfico lo indica la principal y más común causa es la curiosidad, mientras que la más escasa es la presión social.
Como podemos ver en la gráfica, en presión social no hay nada de dispersión pues solo toca los 15 años, mientras que en otros y por curiosidad hay más movimiento pues oscilan entre 15 a 16 años y 14 a 17 respectivamente, los cuales son rangos mucho más cortos en comparación a por amigos el cual abarca un panorama de 13 a 19 años.
Mediana:
## Otros Por amigos Por curiosidad Por presión social
## 16 15 16 15
La gráfica de barras muestra que hay una predominancia por las sustancias de cannabis y vapeadores, mientras que otras tales como el cigarrillo son menormente consumidas.
Cig,Ci = Cigarrillos
Vap,Va = Vapeadores
Can,Ca = Cannabis
Es notable una predominancia sobre el consumo de vapeadores por encima de las demás sustancias en las mujeres. Por otra parte, el comportamiento de los hombres muestra que hay una preferencia por el cannabis, seguido del vaporizador, y que hay una gran porción de quienes hacen estas dos juntas, que también fuman cigarrillo.
Mediana:
## Can Ci,Va,Ca Cig, Can Cig, Vap Vap Vap, Can
## 19 19 20 20 19 19
Respecto con las edades de los diferentes tipos de consumidores vemos que la mayoría tiene una mediana parecida y que sus rangos son cortos de 1 a 3 años, exceptuando a los consumidores únicamente de vaporizadores el cual su población es más joven tal como se ve en su media y por su rango; por ultimo los consumidores de vaporizadores y cannabis oscilan mucho sus edades y tienen un rango de 19 hasta 36 años que nos hace identificar que esta población es mayor en edad.
La gráfico de pastel enseña que los sujetos a experimento tienen respeto por la universidad y solo el 10.71% consume ahí, mientras una ligera porción lo hace en casa; y la gran mayoría en otros espacios permitiéndonos ver que el consumo es más de un ambiente social y de ocio.
Con respecto a las edades en los espacios de consumo, los que consumen en la universidad tienen un rango de mayores edades, aunque su mediana es la más joven con respecto a quienes lo hacen en otros lugares o casa, pues estos dos tienen rangos muy cortos y parecidos, al igual que su mediana la cual es 19 y 19,5 respectivamente.
Mediana:
## Casa Otro espacio Universidad
## 19 19 18
Frecuencia de consumo:
Los consumidores de diario son la moda en este estudio muy por encima de quienes consumen de 2 a 4 días el cual es la opción menos frecuente; y las porciones de quienes consumen de manera mensual, semanal o más de un mes se comportan bastante igual.
La frecuencia de consumo de las mujeres está bien distribuido entre los intervalos escogidos, sin mostrar preferencias significativas. Mientras que en los hombres hay un sesgo hacia el consumo diario por encima de los demás, que también son muy iguales.
Quienes lo hacen más de 30 días en su mayoría tienen 20 años y tienen dos datos atípicos de 19 y 21 años; parecido a los consumidores mensuales que todo el rango intercuartílico es 19 años y tiene dos datos atípicos, uno en 18 y otro en 20 años; quienes consumen de 2 a 4 días son los menores del estudio presentan el dato de edad más joven con 18 años, mientras que los de diario quienes eran la mayor porción consumidora resultan tener edades en su mayoría inferior a 19 años con un dato muy atípico; por ultimo quienes lo hacen semanal muestran ser los más dispersos así como los de mayores edades.
Mediana:
## +de 30 dias De 2 a 4 dias Diario Mensual Semanal
## 20 19 19 18 20
La moda es gastar entre $0-$50.000 con 16 encuestados siendo el 53,5%, quienes gastan entre $50.000 y $200.000 representan el 35,7% distribuidos equitativamente en ambos intervalos del rango; y respecto a la porción de quienes gastan más de $200.000 es del 10,8% . (X = Gasto mensual)
Tanto hombres como mujeres comparten una moda de gastar menos de 50 mil pesos mensualmente para la compra de sustancias que van a fumar, la cual es muy superior a los demás intervalos analizados.
La porción que gasta entre $125.000 a $200.000 presenta la mayor dispersión con un rango grande de edades, mientras que en los demás escenarios los datos varían muy poco.
Mediana:
## $125 - $200 $50 - $125 X<$50 X>$200
## 20 19 20 19
En base al gráfico de barras es superior la gente que quisiera dejar de hacerlo por lo que podemos ver la introspección de ellos al saber que están haciendo afecciones en su salud. Quienes dicen que No, son una población joven que no pasa de los 20 años a excepción de sus dos datos atípicos; mientras que quienes contestaron “si” tienen una mediana de 19,94 pero manejan un sesgo positivo.
Mediana si: 19 Mediana no: 19
Tanto en hombres como mujeres se da el mismo comportamiento de las poblaciones, en donde hay una mayoría que muestra un interés en dejar de fumar, mientras que hay otra que no lo hace.
Después del trabajo de investigación realizado con una muestra de 50 estudiantes encuestados de la universidad nos da pie para generalizar y concluir acerca de la población fumadora y no fumadora de la universidad. A partir del estudio nos damos cuenta que la mitad de la población universitaria fuma, lo que quiere decir que el consumo en jóvenes universitarios de la Pontificia Universidad en Cali está bastante normalizado. Dentro de la población fumadora podemos destacar, primero, los estudiantes de la facultad de ciencias económicas y administrativas representan la mitad de esa población fumadora tano en hombres como en mujeres, así mismo los vaporizadores son la sustancia de mayor consumo, siendo el medio de consumo predominante de los estudiantes de la universidad, sin embargo, el consumo dentro de la universidad es el menos frecuente.Segundo, podemos concluir que hay una predominancia de los hombres sobre las mujeres en cuanto a la proporción fumadora y el interés por fumar de ambos sexos. Tercero, el dinero destinado al consumo es menor a 50mil pesos mensuales, esto probablemente debido a que la mayoría de población fumadora es menor de 20 años, suponiendo un bajo poder adquisitivo. Cuarto, la población fumadora se distribuye igualitaria mente entre ambos géneros y se presenta un deseo de dejar el hábito en la mayoría de la población universitaria. Finalmente en casi todas las gráficas donde comparamos hombres y mujeres en cuestiones actitudinales reflejan un comportamiento muy similar, lo cual nos permite concluir que hay pocas diferencias en su razonamiento. Exceptuando los gráficos que reflejan más sustancias consumidas, mostrando que los hombres sí consumen cigarrillo, a diferencia de las mujeres de la muestra.
Para las hipótesis expuestas en la siguiente sección, su veracidad en gran parte prima en que las muestras sigan una distribución normal, si esta condición no se llega a cumplir, la existencia de las pruebas de hipótesis únicamente se realizaran por fines académicos.
H0: La muestra proviene de una población normal H1: La muestra no proviene de una población normal
##
## Shapiro-Wilk normality test
##
## data: x0
## W = 0.79894, p-value = 8.287e-07
##
## Shapiro-Wilk normality test
##
## data: x
## W = 0.93772, p-value = 0.1071
##
## Shapiro-Wilk normality test
##
## data: x1
## W = 0.61104, p-value = 1.195e-06
##
## Shapiro-Wilk normality test
##
## data: x2
## W = 0.94277, p-value = 0.2703
##
## Shapiro-Wilk normality test
##
## data: x3
## W = 0.87152, p-value = 0.156
##
## Shapiro-Wilk normality test
##
## data: x4
## W = 0.88655, p-value = 0.02325
##
## Shapiro-Wilk normality test
##
## data: x5
## W = 0.69305, p-value = 0.001879
H0: Ph = Pm H1:Ph > Pm
Ph = Proporción hombres fumadores
Pm = Proporción mujeres fumadoras
Nivel de significancia: 0.05
##
## 2-sample test for equality of proportions with continuity correction
##
## data: c(proph * n2, propm * n1) out of c(n2, n1)
## X-squared = 6.2688, df = 1, p-value = 0.006144
## alternative hypothesis: greater
## 95 percent confidence interval:
## 0.138349 1.000000
## sample estimates:
## prop 1 prop 2
## 0.7407407 0.3478261
prop 1 = Proporción hombres fumadores, prop 2 = Proporción mujeres fumadoras
Con un nivel de confianza del 95% se puede afirmar que la proporción de hombres fumadores es mayor que la proporción de mujeres fumadoras,rechazando la hipótesis nula, al obtener un valor p menor al nivel de significancia.
H0: MU = 19 H1:MU ≠ 19
MU = Media de edad entrevistados (Media de edad de estudiantes de una universidad de Cali)
Nivel de significancia: 0.05
##
## One-sample z-Test
##
## data: data
## z = 2.2545, p-value = 0.02416
## alternative hypothesis: true mean is not equal to 19
## 95 percent confidence interval:
## 19.08885 20.27115
## sample estimates:
## mean of x
## 19.68
Con un nivel de confianza del 95% se rechaza la hipótesis nula, existe suficiente evidencia para afirmar que la media es distinta a 19 años, obteniendo un valor p menor al nivel de significancia.
H0: MEH - MEM = 1 H1:PEH - PEM ≠ 1
MEH = Media de edad hombres MEM = Media de edad mujeres
Nivel de significancia: 0.05
##
## Welch Two Sample t-test
##
## data: datt1 and datt2
## t = -0.74263, df = 36.869, p-value = 0.4624
## alternative hypothesis: true difference in means is not equal to 1
## 95 percent confidence interval:
## -0.7352741 1.8045172
## sample estimates:
## mean of x mean of y
## 19.92593 19.39130
Con un nivel de confianza del 95% se rechaza la hipótesis nula, con la salvedad de que el valor p es muy próximo al nivel de significancia, existe suficiente evidencia para afirmar que la diferencia de medias es distinta a 1 año, obteniendo un valor p menor al nivel de significancia.
##
## Call:
## lm(formula = y ~ x)
##
## Coefficients:
## (Intercept) x
## 16.67736 -0.05169
##
## Call:
## lm(formula = y ~ x)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.5401 -0.6952 0.1756 0.3177 3.3565
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 16.67736 2.85583 5.840 3.73e-06 ***
## x -0.05169 0.14738 -0.351 0.729
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.143 on 26 degrees of freedom
## Multiple R-squared: 0.004709, Adjusted R-squared: -0.03357
## F-statistic: 0.123 on 1 and 26 DF, p-value: 0.7286
## [1] 1.305636
## [1] 0.004709242
## Analysis of Variance Table
##
## Response: y
## Df Sum Sq Mean Sq F value Pr(>F)
## x 1 0.161 0.16062 0.123 0.7286
## Residuals 26 33.947 1.30564
## 2.5 % 97.5 %
## (Intercept) 10.8071205 22.5476032
## x -0.3546439 0.2512571
##
## One Sample t-test
##
## data: residuales
## t = 4.6782e-16, df = 27, p-value = 1
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## -0.4347887 0.4347887
## sample estimates:
## mean of x
## 9.913286e-17
##
## studentized Breusch-Pagan test
##
## data: modelo
## BP = 2.1206, df = 1, p-value = 0.1453
##
## Shapiro-Wilk normality test
##
## data: residuales
## W = 0.90813, p-value = 0.01783