Estadística descriptiva:
1. Cantidad de personas que han escuchado del turismo responsable:
En este contexto, la variable “Q2” mide la cantidad de personas que han
escuchado del turismo responsable vs. las que no.
turismo <- turismo %>%
mutate(Q2 = ifelse(Q2 == 1, "Si", Q2))
turismo <- turismo %>%
mutate(Q2 = ifelse(Q2 == 2, "No", Q2))
ggplot(turismo, aes(x = Q2, fill = Q2)) +
geom_bar() +
labs(title = "¿Ha oído hablar del turismo responsable y/o sostenible?",
x = "Respuestas",
y = "Frecuencia") +
scale_fill_manual(values = c("No" = "lightsalmon2", "Si" = "indianred3"))

Como se puede observar en la gráfica, la mayor cantidad de las
personas encuestadas sí ha escuchado hablar sobre el turismo responsable
y/o sostenible.
2. Sexo de los participantes: A continuación se muestra la variable
“Q2”, la cual engloba los dos sexos de las personas que realizaron la
encuesta, ilustrados en distintos colores.
turismo <- turismo %>%
mutate(Q2 = ifelse(Q2 == 1, "Hombre", Q11))
turismo <- turismo %>%
mutate(Q2 = ifelse(Q2 == 2, "Mujer", Q11))
ggplot(turismo, aes(x = Q2, fill = Q2)) +
geom_bar() +
labs(title = "Sexo de los participantes de la encuesta",
x = "Respuestas",
y = "Frecuencia") +
scale_fill_manual(values = c("Hombre" = "lightblue1", "Mujer" = "peachpuff2"))

También como se puede observar, la mayor parte de los encuestados
son mujeres. También se percibe que en la base de datos algún componente
impide que la asignación de “1” a “hombre” sea leída como “hombre”, pues
solo se refleja como 1.
3. Conocimientos de turismo responsable contrastado con sexo de las
personas: Para esta gráfica se utiliza la variable “Q11”, que nuevamente
hace referencia al sexo de las personas, y “Q2”, que ejemplica el
conocimiento sobre el turismo responsable.
ggplot(data = turismo, aes(x = Q12, y = Q2)) +
geom_boxplot(fill = "#76EEC6", color = "black") +
labs(title = "Comparación de sexo por consciencia de turismo sustentable",
x = "Si saben de turismo responsable",
y = "Sexo")
## Warning: Removed 2 rows containing non-finite values (`stat_boxplot()`).

Parece haber una mayor correlación entre mujeres y el conocimiento
sobre el turismo responsable, aunque también es posible que esto se
encuentre biased por el hecho de la mayoría de encuestadas fueron
mujeres.
4.La cuarta gráfica que haremos es para determinar la cantidad de
personas en el país donde se contestó la encuesta. Para esto se utiliza
la variabale “Q3”, que engloba los dos países encuestados, México y
España.
turismo <- turismo[!is.na(turismo$Q13), ]
turismo <- turismo %>%
mutate(Q13 = ifelse(Q13 == 1, "México", Q13))
turismo <- turismo %>%
mutate(Q13 = ifelse(Q13 == 2, "España", Q13))
ggplot(turismo, aes(x = Q13, fill = Q13)) +
geom_bar() +
labs(title = "País en el que realiza la encuesta",
x = "Respuestas",
y = "Frecuencia") +
scale_fill_manual(values = c("México" = "pink", "España" = "cornsilk1"))

Podemos concluir que la mayoría de las personas encuestadas lo
fueron en el país de México por una diferencia de poco más de 100
personas.
5. Viajes en el último año: Para conocer esto se utiliza la
variabale “Q7”, la cual contiene la cantidad de viajes al año que
proporcionaron los encuestados.
# Histograma para Q7 (Cantidad de viajes en el último año)
ggplot(data = turismo, aes(x = Q7)) +
geom_histogram(binwidth = 1, fill = "lightgoldenrod1", color = "black") +
labs(title = "Distribución de la Cantidad de Viajes en el Último Año",
x = "Cantidad de Viajes",
y = "Frecuencia")
## Warning: Removed 12 rows containing non-finite values (`stat_bin()`).

Se puede observar que hay una concentración mucho mayor en la
cantidad 3, con las otras dos opciones más prominentes siendo 2 y
4.
9. Edad vs. esfuerzo en no causar impacto negativo: Esta gráfica de
dispersión se centra en la relación entre la edad de las personas
(Variable Q12) y la importancia que le dan a no causar un impacto
negativo ambiental o social con su presencia (Q6_6).
ggplot(turismo, aes(x = Q12, y = Q6_6)) +
geom_point(color = "#EED5D2", size = 3, alpha = 0.7) +
labs(x = "Edad", y = "Mi impacto") +
ggtitle("Comparación de Edad vs. Mi impacto") +
theme_minimal() +
theme(plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
axis.title = element_text(size = 14),
axis.text = element_text(size = 12))
## Warning: Removed 2 rows containing missing values (`geom_point()`).

Podemos observar que la mayoría de las personas, su edad indistinta,
se encuentran en los tres niveles superiores de preocupación por evitar
el daño. Otro dato interesante podría ser cómo los niveles inferiores de
preoupación parecen estar centrados en personas menores de 25 años o
entre 50 y 75 años.
10. Planificación de los viajes: En esta gráfica se muestra por país
(Q13), quiénes planifican los viajes que realizan los encuestados
(Q9).
ggplot(turismo, aes(x = factor(Q13), fill = factor(Q9))) +
geom_bar() +
labs(x = "País", y = "Recuento", fill = "Quién organiza y planifica los viajes") +
ggtitle("Comparación de País con Organización de Viajes") +
scale_x_discrete(labels = c("1" = "México", "2" = "España")) +
scale_fill_manual(values = c("1" = "violet", "2" = "pink", "3" = "beige"),
labels = c("1" = "Principalmente yo", "2" = "Principalmente otras personas", "3" = "Tanto yo como otras personas")) +
theme_minimal() +
theme(plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
axis.title = element_text(size = 14),
axis.text = element_text(size = 12))

Como se puede observar, en los dos países es más presente que las
mismas personas lo organicen, en México siendo casi igual la proporción
de “tanto yo como otras personas”.
11. Promedio de viajes: En esta gráfica se observa el promedio de
viajes anuales (variable Q7) en relación con los dos países disponibles
(Q13).
ggplot(turismo, aes(x = factor(Q13), y = Q7)) +
geom_bar(stat = "summary", fun = "mean", position = "dodge", fill = c("#EED5D2", "#FFA07A")) +
labs(x = "País", y = "Promedio de Viaje") +
ggtitle("Promedio de Viaje Comparado entre Españoles y Mexicanos") +
scale_x_discrete(labels = c("1" = "México", "2" = "España")) +
theme_minimal() +
theme(plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
axis.title = element_text(size = 14),
axis.text = element_text(size = 12))
## Warning: Removed 12 rows containing non-finite values (`stat_summary()`).

Se puede observar que el promedio es bastante similar, con México
siendo ligeramente superior.
Conclusión del análisis descriptivo
Como conclusión general, se puede llegar a lo siguiente: Existen
factores que inevitable causarán cierto sesgo en los resultados, como la
diferencia entre nacionalidades y sexos encuestados. Sin embargo, hay
varios puntos rescatables. La preocupación por el medioambiente parece
ser moderada, lo cual tiene sentido en relación a la cantidad de
personas que conocen sobre el turismo responsable, que también parece
ser moderado en relación con las personas que no, y parece estar
inclinado hacia la población femenina. Las personas, sin distinción de
edad, parecen preocupadas por su impacto socioambiental. También existe
una marcada concentración de encuestados pertenecientes a una población
joven y mexicana, los cuales realizan entre 2 y 3 viajes al año. Tomando
en cuenta la comparación entre los diversos resultados y el hecho de que
la preocupación por la sostenibilidad se encuentra en un término
moderado-alto (debido a que la escala era de 7 y la respuesta mayor es
5), se podría especular sobre la posibilidad de que este número
aumentase de manera importante si igualmente se incrementara la
conciencia sobre el turismo consciente -quizá orientado a la población
masculina-, ya que los resultados sobre el interés fueron favorables a
pesar de la gran cantidad de personas que no conocían de este término en
específico. Otro tema de relevancia es que la edad joven y madura parece
ser donde se encuentra la concentración de personas que se preocupan
menos por su impacto. Así mismo, en promedio en los dos países se viaja
lo mismo, con México ligeramente a la delantera, y en ambos casos lo más
común es que la persona planifique su viaje.
Instrucciones
I. A partir de la base de datos Turismo Responsable realiza los
planteamientos de hipótesis entorno a las referencias sobre Turismo
Responsable que se presentan a continuación. Realiza las Pruebas de
Hipótesis (PH) con una significancia del 5%.
PH 1
1. PH para una proporción. El (86.6%) de los españoles reservan su
viaje por internet ellos mismos (Acosta, E., 2019). Var Q9.
Hipótesis nula: la proporción de turistas españoles que reservan su
viaje ellos mismos es igual a 86.6%.
Hipótesis alterna: la proporción de turistas españoles que reservan
su viaje ellos mismos es diferente a 86.6%.
turismo <- turismo[!is.na(turismo$Q9), ]
summary(turismo$Q9)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 1.000 2.000 1.927 3.000 3.000
turismo <- turismo[!is.na(turismo$Q9), ]
summary(turismo$Q9)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 1.000 2.000 1.927 3.000 3.000
n <- length(turismo$Q9)
prop_obs <- mean(turismo$Q9)
prop_expected <- 0.866
prop_test_result <- prop.test(x = sum(turismo$Q9 == 1), n = n, p = prop_expected, alternative = "two.sided")
print(prop_test_result)
##
## 1-sample proportions test with continuity correction
##
## data: sum(turismo$Q9 == 1) out of n, null probability prop_expected
## X-squared = 1656.2, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.866
## 95 percent confidence interval:
## 0.3770681 0.4414882
## sample estimates:
## p
## 0.4088937
Respuesta PH 1
Como resultado, tenemos que que 0.4080087 > 0.05 (alfa), en este
caso no se rechaza la hipótesis nula. Esto significa que no hay
evidencia suficiente para afirmar que la proporción de turistas
españoles que reservan su viaje ellos mismos es diferente del 86.6%. Con
un nivel de confianza del 95%, no podemos concluir que la afirmación de
que el 86.6% de los españoles reservan su viaje ellos mismos sea
falsa.
Es importante mencionar que se debe de tomar en cuenta que el no
rechazar la hipotesis nula no necesariamente significa que la afirmación
sea la corecta, simplemente significa que en la base de datos que
tenemos no existe evidencia suficiente para decir que la afirmación sea
cierta.
PH 2
2. PH para una proporción. Casi la mitad de los viajeros en México
eligen un destino con la intención de contribuir en la economía de una
comunidad local (Gamez, R., 2019). Var Q6_4
Hipótesis nula: la proporción de turistas mexicanos que fomento el
desarrollo local del destino consumiendo productos y servicios locales
es mayor o igual al 50%.
Hipótesis alterna: la proporción de turistas mexicanos que fomento
el desarrollo local del destino consumiendo productos y servicios
locales es menor al 50%.
summary(turismo$Q6_4)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 4.000 5.000 4.992 6.000 7.000
n <- length(turismo$Q6_4)
prop_obs <- mean(turismo$Q6_4)
prop_expected <- 0.5
prop_test_result <- prop.test(x = sum(turismo$Q6_4 <= 3), n = n, p = prop_expected, alternative = "less")
print(prop_test_result)
##
## 1-sample proportions test with continuity correction
##
## data: sum(turismo$Q6_4 <= 3) out of n, null probability prop_expected
## X-squared = 391.76, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is less than 0.5
## 95 percent confidence interval:
## 0.0000000 0.1955639
## sample estimates:
## p
## 0.1735358
Respuesta PH 2
Dado el valor p de 0.1731602, no contamos con evidencia suficiente
para rechazar la hipótesis nula. Esto significa que no hay suficiente
evidencia estadística para afirmar que la proporción de turistas
mexicanos que fomentan el desarrollo local del destino consumiendo
productos y servicios locales es menor al 50%.
PH 3
3. PHp para una proporción. El 55% de los encuestados españoles
afirman que, si tuvieran la posibilidad, compensarían la huella de
carbono en su alojamiento vacacional (Gamez, R., 2019). Var Q6_11
Hipótesis nula: la proporción de turistas españoles que afirman que
compensarían la huella de carbono en su alojamiento vacacional es igual
al 55%.
Hipótesis alterna: la proporción de turistas españoles que afirman
que compensarían la huella de carbono en su alojamiento vacacional es
diferente al 55%.
summary(turismo$Q6_11)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 1.000 2.000 2.719 4.000 7.000
n <- length(turismo$Q6_11)
prop_obs <- mean(turismo$Q6_11)
prop_expected <- 0.55
prop_test_result <- prop.test(x = sum(turismo$Q6_11 == 1), n = n, p = prop_expected, alternative = "two.sided")
print(prop_test_result)
##
## 1-sample proportions test with continuity correction
##
## data: sum(turismo$Q6_11 == 1) out of n, null probability prop_expected
## X-squared = 74.745, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.55
## 95 percent confidence interval:
## 0.3760010 0.4403953
## sample estimates:
## p
## 0.4078091
Respuesta de PH 3
Dado un valor p de 0.4069264, igual que las veces anteriores, no se
cuenta con evidencia para rechazar la hipotesis nula. No se puede
afirmar que la proporción de turistas españoles que afirman que
compensarían la huella de carbono en su alojamiento vacacional es
diferente del 55%, como se mencionaba en la hipótesis alterna.
PH 4
PHp para las medias de dos poblaciones normales e independientes.
Los mexicanos se desplazan principalmente una vez cada seis meses, es
decir, realizan dos viajes al año. Para los españoles la media anual es
de 3 viajes (Galván, F, 2017; Piñas, A., 2018). Var Q7
Hipótesis nula: la cantidad promedio de viajes que realizan los
mexicanos es igual a la cantidad de viajes que realizan los
españoles.
Hipótesis alterna: la cantidad promedio de viajes que realizan los
mexicanos es diferente a la cantidad de viajes que realizan los
españoles.
turismo <- turismo[!is.na(turismo$Q7), ]
summary(turismo$Q7)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 2.000 3.000 3.764 4.000 70.000