1 Introducción

Se nos presenta una base de datos que tiene el objetivo de conocer en qué medida los viajeros actúan como turistas responsables inspirado en el Manifiesto del viajero responsable propuesto por la Fundación Intermundial, el Instituto de Turismo Responsable, RTI y Biosphere.

2 Análisis Descriptivo

2.0.1 Librerías

Las librerías que se utilizarán son las siguientes (en caso de no tenerlas hay que instalarlas):

library(tidyverse)
library(dplyr)
library(ggplot2)
library(summarytools)
library(readxl)
library(janitor)
library(car)
library(scales)

2.0.2 Importar datos

#file.choose()
df <- read_xlsx("C:\\Users\\usuario\\Documents\\1 Tec\\Módulo 3\\Base de Datos SP Turismo Responsable (1).xlsx", sheet="Datos")

2.0.3 Entender la base de datos

Para tener una noción más amplia de los datos que tenemos utilizaremos la función str() para conocer cada una de las variables con sus datos.

str(df)

## tibble [935 × 59] (S3: tbl_df/tbl/data.frame)
##  $ StartDate            : POSIXct[1:935], format: "2020-03-05 08:54:01" "2020-03-05 09:03:48" ...
##  $ EndDate              : POSIXct[1:935], format: "2020-03-05 09:01:58" "2020-03-05 09:05:44" ...
##  $ Status               : num [1:935] 0 0 0 0 0 0 0 0 0 0 ...
##  $ IPAddress            : chr [1:935] "131.178.54.55" "131.178.200.66" "200.95.170.77" "131.178.54.69" ...
##  $ Progress             : num [1:935] 100 100 100 100 100 100 100 100 100 100 ...
##  $ Duration (in seconds): num [1:935] 477 115 257 916 255 ...
##  $ Finished             : num [1:935] 1 1 1 1 1 1 1 1 1 1 ...
##  $ RecordedDate         : POSIXct[1:935], format: "2020-03-05 09:01:59" "2020-03-05 09:05:44" ...
##  $ ResponseId           : chr [1:935] "R_1HNq2eWcYHIucIF" "R_3GlhbBuuVXrn7Wa" "R_27Nh8d4iF86rUuK" "R_uf5wi6KfNeBnmal" ...
##  $ RecipientLastName    : logi [1:935] NA NA NA NA NA NA ...
##  $ RecipientFirstName   : logi [1:935] NA NA NA NA NA NA ...
##  $ RecipientEmail       : logi [1:935] NA NA NA NA NA NA ...
##  $ ExternalReference    : logi [1:935] NA NA NA NA NA NA ...
##  $ LocationLatitude     : num [1:935] 25.7 25.6 25.7 25.6 25.8 ...
##  $ LocationLongitude    : num [1:935] -100 -100 -100 -100 -100 ...
##  $ DistributionChannel  : chr [1:935] "anonymous" "anonymous" "anonymous" "anonymous" ...
##  $ UserLanguage         : chr [1:935] "EN" "EN" "EN" "EN" ...
##  $ Q2                   : num [1:935] 1 1 1 1 1 1 2 1 1 2 ...
##  $ Q3_1                 : num [1:935] 1 1 1 NA 1 1 2 2 2 1 ...
##  $ Q3_2                 : num [1:935] 2 2 2 NA 3 2 1 3 3 2 ...
##  $ Q3_3                 : num [1:935] 3 3 3 NA 2 3 3 1 1 3 ...
##  $ Q4_1                 : num [1:935] 1 1 1 NA 1 1 1 1 NA 1 ...
##  $ Q4_2                 : num [1:935] NA 1 1 1 1 1 NA 1 1 1 ...
##  $ Q4_3                 : num [1:935] 1 1 1 1 1 1 1 1 NA 1 ...
##  $ Q4_4                 : num [1:935] NA 1 NA 1 1 1 1 NA NA NA ...
##  $ Q4_5                 : num [1:935] NA 1 NA 1 NA NA 1 NA NA NA ...
##  $ Q4_6                 : num [1:935] 1 1 NA NA 1 1 NA NA NA 1 ...
##  $ Q4_7                 : num [1:935] NA 1 1 NA 1 1 1 1 1 1 ...
##  $ Q4_8                 : num [1:935] 1 1 1 1 NA 1 1 NA NA 1 ...
##  $ Q4_9                 : num [1:935] NA 1 NA 1 NA 1 1 NA NA 1 ...
##  $ Q4_10                : num [1:935] NA 1 1 NA 1 1 1 1 1 1 ...
##  $ Q4_11                : num [1:935] NA 1 1 1 NA NA NA NA NA NA ...
##  $ Q4_12                : num [1:935] 1 1 1 NA NA 1 1 NA NA NA ...
##  $ Q6_1                 : num [1:935] 4 7 7 5 7 7 5 5 5 5 ...
##  $ Q6_2                 : num [1:935] 5 6 5 7 5 7 7 5 5 5 ...
##  $ Q6_3                 : num [1:935] 7 6 5 6 7 7 7 5 5 6 ...
##  $ Q6_4                 : num [1:935] 4 5 6 5 5 7 7 5 5 7 ...
##  $ Q6_5                 : num [1:935] 6 5 7 6 6 7 7 4 4 6 ...
##  $ Q6_6                 : num [1:935] 7 4 7 5 7 7 5 4 3 7 ...
##  $ Q6_7                 : num [1:935] 7 6 6 7 7 4 4 2 4 5 ...
##  $ Q6_8                 : num [1:935] 7 7 7 5 7 7 7 7 4 7 ...
##  $ Q6_9                 : num [1:935] 5 6 7 6 6 7 3 5 4 4 ...
##  $ Q6_10                : num [1:935] 6 6 7 5 7 7 3 6 4 2 ...
##  $ Q6_11                : num [1:935] 4 6 1 5 3 7 1 1 4 1 ...
##  $ Q6_12                : num [1:935] 4 6 3 5 7 7 7 2 4 6 ...
##  $ Q6_13                : num [1:935] 5 6 7 6 5 7 3 3 4 2 ...
##  $ Q6_14                : num [1:935] 4 5 4 6 5 4 1 3 4 3 ...
##  $ Q6_15                : num [1:935] 5 6 5 3 3 2 1 2 4 1 ...
##  $ Q6_16                : num [1:935] 7 5 7 7 7 7 4 5 4 4 ...
##  $ Q6_17                : num [1:935] 3 6 7 4 5 7 4 6 4 4 ...
##  $ Q6_18                : num [1:935] 4 6 4 6 4 2 1 1 4 3 ...
##  $ Q7                   : num [1:935] 3 4 3 4 2 4 2 20 0 0 ...
##  $ Q10                  : num [1:935] 1 4 4 4 1 3 1 3 2 1 ...
##  $ Q9                   : num [1:935] 2 1 3 1 3 1 3 1 2 2 ...
##  $ Q12                  : num [1:935] 19 22 21 22 21 56 36 23 21 22 ...
##  $ Q12_1                : num [1:935] 1 1 1 1 1 4 2 1 1 1 ...
##  $ Q11                  : num [1:935] 2 1 2 2 2 2 2 2 1 1 ...
##  $ Q13                  : num [1:935] 1 1 1 1 1 1 1 1 1 1 ...
##  $ ...59                : logi [1:935] NA NA NA NA NA NA ...

2.0.4 Limpiar la base de datos

Removemos los NA de la columna que nos indica en dónde fue realizada la encuesta.

Esto debido a que los registros que no tenemos información acerca de esa pregunta, no podremos segmentarlos, por lo que aunque sería perder esa información, es información que de igual manera sesgaría el análisis.

df <- df[!is.na(df$Q13),]
colnames(df)[which(names(df) == "Duration (in seconds)")] <- "Duration"

De igual manera, removemos las columnas o variables que no aporten algo al análisis, ya sea porque no tienen algun valor o porque su información no sirva para aportar.

df2 <- subset(df, select = -c(Status, RecipientLastName, RecipientFirstName, RecipientEmail, ExternalReference, StartDate, EndDate, IPAddress, RecordedDate, ResponseId, LocationLatitude, LocationLongitude, DistributionChannel, UserLanguage))

En la pregunta 4 nos damos cuenta que los valores NA significa que la persona no le da importancia a esa variable a la hora de armar su viaje, por lo que las vamos a reemplazar por el valor 0 para poder utilizarlo en análisis.

df2  <- df2 %>%
  mutate_at(c('Q4_1', 'Q4_2', 'Q4_3', 'Q4_4', 'Q4_5', 'Q4_6', 'Q4_7', 'Q4_8', 'Q4_9', 'Q4_10', 'Q4_11', 'Q4_12'), ~replace_na(.,0))

2.0.5 Explicación de variables

Ya que tenemos limpia la base de datos que estaremos trabajando, procederemos a la explicación de las variables.

Progress: Se refiere al progreso que tuvo la persona encuestada en la encuesta, significando el valor 100 que terminaron la encuesta.
Duration (in seconds): Nos permite saber cuántos segundos se tardaron en llegar al progreso que tienen, una persona que se haya tardado 60 segundos o 1 minuto en tener el 100% del progreso nos indica que no le metió pensamiento y posiblemente sus datos no nos sirvan.
Finished: Se refiere a si la encuesta fue completada en su totalidad.
Q2: Indica si la persona encuestada ha oído hablar del turismo responsable, siendo el 1 “sí”, y el 2 “No”.
Q3: La pregunta 3 con sus variantes busca hacer que la persona encuestada ordene los aspectos más importantes en cuestión de cuáles son más procurados por el turismo responsable, siendo el 1 el más importante.
Q6: En las preguntas variantes de las 6 dan ciertas afirmaciones y la persona encuestada decide que tanto definen su forma de actuar con la escala siguiente:
- 1 - No me representa
- 7 - Me representa totalmente
Q7: Esta pregunta nos permite conocer cuántos viajes ha hecho la persona encuestada en el último año.
Q10: Esta pregunta indica la razón principal de los viajes contestados en la pregunta 7.
Q9: Esta variable indica quién planificó los viajes de la pregunta 7.
Q12: Nos indica la edad en años de la persona encuestada
Q12_1: La edad en rango:
- 1 - Edad < 25
- 2 - 25 < edad < 40
- 3 - 40 < edad < 55
- 4 - 55 < edad < 65
- 5 - edad > 65
Q11: Nos indica el sexo de la persona encuestada:
- 1 - Hombre
- 2 - Mujer
Q13: Indica el país en el que se contestó la encuesta:
- 1 - México
- 2 - España

3 Gráficas

3.0.1 Progreso de la encuesta por sexo

La siguiente gráfica nos permitirá conocer la cantidad de personas que terminaron la encuesta y la cantidad de personas que no la terminaron, esto divido por sexo del encuestado.

t_Finished <- table(df2$Finished, df2$Q11)
colnames(t_Finished) <- c("Hombres", "Mujeres")
rownames(t_Finished) <- c("No terminó", "Terminó")
t_Finished

##             
##              Hombres Mujeres
##   No terminó      43      66
##   Terminó        360     464

barplot(t_Finished,
        main="Gráfica de finalización de encuesta",
        col = c("seagreen4", "palegreen"),
        xlab = "Sexo",
        ylab = "Frecuencia")
legend(x="topright",
       legend=c("No terminó", "Sí terminó"),
       fill = c("seagreen4", "palegreen"))

3.0.2 Proporción de conocimiento de Turismo Responsable

La siguiente gráfica nos permite conocer la proporción de hombres y mujeres que sí han escuchado hablar del turismo responsable.

df_escuchado <- df2[df2$Q2 == 1,]
df_escuchado <- data.frame(
  Sexo = df_escuchado$Q11,
  Edad = df_escuchado$Q12_1
)

df_escuchado$Sexo[df_escuchado$Sexo == "1"] <- "Hombre"
df_escuchado$Sexo[df_escuchado$Sexo == "2"] <- "Mujer"

head(df_escuchado)

##     Sexo Edad
## 1  Mujer    1
## 2 Hombre    1
## 3  Mujer    1
## 4  Mujer    1
## 5  Mujer    1
## 6  Mujer    4

ggplot(df_escuchado, aes(x="", y=Edad, fill = Sexo)) +
  geom_bar(stat="identity") +
  coord_polar("y", start=0) +
  theme_minimal()

3.0.3 Rango de la edad

La siguiente gráfica nos permite identificar el rango en cuartiles de edad separado por sexo de las personas y separado también por el lugar en el que fue realizada la encuesta.

ggplot(df, aes(x = factor(Q11), y = Q12, fill=factor(Q13))) +
  geom_boxplot() +
  labs(title = "Age by Gender", x = "Género", y = "Edad") +
  scale_x_discrete(labels=c("Hombre", "Mujer")) +
  scale_fill_discrete(labels=c("México", "España")) +
  theme_minimal()

3.0.4 Duración de la llamada y viajes (suavizada)

ggplot(df2, aes(y=Duration, x=Q7)) +
  geom_point(aes(col=factor(Q13))) +
  geom_smooth(method="loess", se=F) +
  xlim(0,75) +
  ylim(0,500)

## `geom_smooth()` using formula = 'y ~ x'

ggplot(df2, aes(y=Duration, x=Q7)) +
  geom_point(aes(col=factor(Q13))) +
  geom_smooth(method="loess", se=F) +
  xlim(0,75) +
  ylim(0,1000)

## `geom_smooth()` using formula = 'y ~ x'

ggplot(df2, aes(y=Duration, x=Q7)) +
  geom_point(aes(col=factor(Q13))) +
  geom_smooth(method="loess", se=F) +
  xlim(0,75)

## `geom_smooth()` using formula = 'y ~ x'

3.0.5 Duración de la llamada y viajes (best fit)

ggplot(df2, aes(y=Duration, x=Q7)) +
  geom_point(aes(col=factor(Q13))) +
  geom_smooth(method="lm", se=F) +
  xlim(0,75) +
  ylim(0,500)

## `geom_smooth()` using formula = 'y ~ x'

ggplot(df2, aes(y=Duration, x=Q7)) +
  geom_point(aes(col=factor(Q13))) +
  geom_smooth(method="lm", se=F) +
  xlim(0,75) +
  ylim(0,1000)

## `geom_smooth()` using formula = 'y ~ x'

ggplot(df2, aes(y=Duration, x=Q7)) +
  geom_point(aes(col=factor(Q13))) +
  geom_smooth(method="lm", se=F) +
  xlim(0,75)

## `geom_smooth()` using formula = 'y ~ x'

3.0.6 Cantidad de viajes

Las siguiente gráfica nos permitirá identificar los viajes que han realizado los encuestados en los últimos 12 meses.

# Creación los intervalos y asignar etiquetas a los grupos
intervalos <- c(0, 5, 10, 15, Inf)  # Define los límites de los intervalos
etiquetas <- c("5 o menos", "Entre 6 y 10", "Entre 11 y 15", "15 o más")  
# Etiquetas para los grupos

# Agregar una nueva columna con los grupos
df2$Q7_grupos <- cut(df2$Q7, breaks = intervalos, labels = etiquetas, right = FALSE)

# Creación de la gráfica de barras

ggplot(df2, aes(x = factor(Q7_grupos))) +
  geom_bar(fill = c("seagreen4", "seagreen3", "seagreen2", "seagreen1", "black")) +
  labs(title = "¿Cuántos viajes haz realizado en el último año?", 
       x = "Cantidad de viajes", y = "Frecuencia")

3.0.7 Q4

gr_q4 <- df2 %>% select(starts_with("Q4"))
gr_q4

## # A tibble: 933 × 12
##     Q4_1  Q4_2  Q4_3  Q4_4  Q4_5  Q4_6  Q4_7  Q4_8  Q4_9 Q4_10 Q4_11 Q4_12
##    <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1     1     0     1     0     0     1     0     1     0     0     0     1
##  2     1     1     1     1     1     1     1     1     1     1     1     1
##  3     1     1     1     0     0     0     1     1     0     1     1     1
##  4     0     1     1     1     1     0     0     1     1     0     1     0
##  5     1     1     1     1     0     1     1     0     0     1     0     0
##  6     1     1     1     1     0     1     1     1     1     1     0     1
##  7     1     0     1     1     1     0     1     1     1     1     0     1
##  8     1     1     1     0     0     0     1     0     0     1     0     0
##  9     0     1     0     0     0     0     1     0     0     1     0     0
## 10     1     1     1     0     0     1     1     1     1     1     0     0
## # ℹ 923 more rows

Se hace la sustitución de los valores NA para poder hacer la suma, ya que los 1 significa que sí es un factor que le interese y el NA es que no.

gr_q4[is.na(gr_q4)] <- 0
suma_grq4 <- colSums(gr_q4)

# Creación de una gráfica de barras para mostrar la cantidad de respuestas por opción.

ggplot(data = data.frame(columnas = names(suma_grq4), suma = suma_grq4), aes(x = columnas, y = suma, fill = columnas)) +
  geom_bar(stat = "identity") +
  labs(title = "Aspectos que se tienen en cuenta al organizar un viaje",
       x = "Aspectos",
       y = "Suma") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  scale_fill_discrete(guide = FALSE)  # Para ocultar la leyenda de colores

## Warning: The `guide` argument in `scale_*()` cannot be `FALSE`. This was deprecated in
## ggplot2 3.3.4.
## ℹ Please use "none" instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Q4_1: Costo de viaje
Q4_2: Seguridad del destino
Q4_3: Oferta turística del destino
Q4_4: Números de desplazamientos necesarios
Q4_5: Que no haya que invertir mucho tiempo en desplazamientos
Q4_6: Medios de transporte disponibles
Q4_7: Conocer una cultura diferente
Q4_8: Conocer parajes diferentes
Q4_9: Oferta gastronómica
Q4_10: Recomendaciones de otros visitantes
Q4_11: Exclusividad
Q4_12: Temporada del año

3.0.8 Motivo de los viajes por sexo y por país

# Crear un vector de colores personalizados y un vector de etiquetas
colores_personalizados <- c("seagreen1", "seagreen3", "seagreen4", "mediumseagreen", "black")
etiquetas_personalizadas <- c("Ocio o visita a familiares", "Estudio", "Trabajo", "Otras razones", "NA")

## Se eliminan espacios en blanco
gr_motivoviajesexo <- df2 %>%
  filter(Q9 != "", Q11 != "")

# Gráfico de barras apiladas con colores y etiquetas personalizadas en la leyenda
ggplot(gr_motivoviajesexo, aes(x = factor(Q11), fill = factor(Q10))) +
  geom_bar(position = "stack") +
  labs(title = "Relación entre Género y Razones de Viaje",
       x = "Sexo", y = "Frecuencia",
       fill = "Razones de viaje") +
  scale_x_discrete(labels = c("Hombre", "Mujer")) +
  scale_fill_manual(values = colores_personalizados, labels = etiquetas_personalizadas) +  # Cambiar la leyenda
  theme_minimal() +
  theme(legend.position="right")

3.0.9 Motivo de los viajes por país

# Crear un vector de colores personalizados y un vector de etiquetas
colores_personalizados <- c("seagreen1", "seagreen3", "seagreen4", "mediumseagreen", "black")
etiquetas_personalizadas <- c("Ocio o visita a familiares", "Estudio", "Trabajo", "Otras razones", "NA")

## Se eliminan espacios en blanco
gr_motivoviajesexo <- df2 %>%
  filter(Q9 != "", Q11 != "")

# Gráfico de barras apiladas con colores y etiquetas personalizadas en la leyenda
ggplot(gr_motivoviajesexo, aes(x = factor(Q13), fill = factor(Q10))) +
  geom_bar(position = "stack") +
  labs(title = "Relación entre Género y Razones de Viaje",
       x = "País", y = "Frecuencia",
       fill = "Razones de viaje") +
  scale_x_discrete(labels = c("México", "España")) +
  scale_fill_manual(values = colores_personalizados, labels = etiquetas_personalizadas) +  # Cambiar la leyenda
  theme_minimal() +
  theme(legend.position="right")

3.0.10 Motivo de mujeres por país

gr_motivomujeres <- df2 %>% filter(Q10 != "", Q11 != "", Q13 != "")
gr_motivomujeres <- gr_motivomujeres %>% filter(Q11 == "2")

ggplot(gr_motivomujeres, aes(x = factor(Q13), fill = factor(Q10))) +
  geom_bar(position = "stack") +
  labs(title = "Relación entre Género y Razones de Viaje (Mujeres)",
       x = "País", y = "Frecuencia",
       fill = "Razones de viaje") +
  scale_x_discrete(labels = c("México", "España")) +
  scale_fill_manual(values = colores_personalizados, labels = etiquetas_personalizadas) +  # Cambiar la leyenda
  theme_minimal() +
  theme(legend.position="right")

3.0.11 Motivo de viajes por hombres

gr_motivohombres <- df2 %>% filter(Q10 != "", Q11 != "", Q13 != "")
gr_motivohombres <- gr_motivohombres %>% filter(Q11 == "1")

ggplot(gr_motivohombres, aes(x = factor(Q13), fill = factor(Q10))) +
  geom_bar(position = "stack") +
  labs(title = "Relación entre Género y Razones de Viaje (Hombres)",
       x = "País", y = "Frecuencia",
       fill = "Razones de viaje") +
  scale_x_discrete(labels = c("México", "España")) +
  scale_fill_manual(values = colores_personalizados, labels = etiquetas_personalizadas) +  # Cambiar la leyenda
  theme_minimal() +
  theme(legend.position="right")

3.0.12 Quién planifica

df2 <- df2[!is.na(df2$Q9),]
df2 <- df2[!is.na(df2$Q10),]

df2$Q9 <- as.factor(df2$Q9)
df2$Q11<- as.factor(df2$Q11)
df2$Q10 <- as.factor(df2$Q10)

ggplot(df2, aes(x = Q11, fill = Q10)) +
  geom_bar(position = "stack") +
  facet_wrap(~ Q9, labeller = labeller(Q9 = c("1" = "Yo", "2" = "Otros", "3" = "Yo y Otros"))) +
  labs(title = "¿Quién planea el viaje?",
       x = "Rango de Edad", y = "Cantidad") +
  scale_fill_manual(values = c("seagreen1", "seagreen3", "seagreen4", "mediumseagreen", "black"), name = "Razón Viaje", labels = c("1" = "Ocio o Visita", "2" = "Estudio", "3" = "Trabajo", "4" = "Otro")) +
  scale_x_discrete(name = "Sexo", labels = c("1" = "Hombres", "2" = "Mujeres")) +
  scale_colour_discrete(na.translate = F)

4 Pruebas de hipótesis

Seleccionamos las columnas que vayamos a poder utilizar en las pruebas y observamos las variables con NAs para ver la factibilidad de eliminarlos.

df <- df %>% select(starts_with("Q"))

na_values <- colSums(is.na(df))
print(na_values)

##    Q2  Q3_1  Q3_2  Q3_3  Q4_1  Q4_2  Q4_3  Q4_4  Q4_5  Q4_6  Q4_7  Q4_8  Q4_9 
##     0    79    79    79   115   233   398   561   562   433   327   453   500 
## Q4_10 Q4_11 Q4_12  Q6_1  Q6_2  Q6_3  Q6_4  Q6_5  Q6_6  Q6_7  Q6_8  Q6_9 Q6_10 
##   444   695   392     0     0     0     0     0     0     0     0     0     0 
## Q6_11 Q6_12 Q6_13 Q6_14 Q6_15 Q6_16 Q6_17 Q6_18    Q7   Q10    Q9   Q12 Q12_1 
##     0     0     0     0     0     0     0     0    12    13    11     2     0 
##   Q11   Q13 
##     0     0

Viendo que eliminar los NAS eliminaría demasiado registros, lo vemos como algo no factible.

Separamos la base de datos por países.

df_mx <- df[df$Q13 == 1,]
df_sp <- df[df$Q13 == 2,]

4.0.1 Hipótesis 1

PH para una proporción. El (86.6%) de los españoles reservan su viaje por internet ellos mismos (Acosta, E., 2019). Var Q9.

Hipótesis Nula: la proporcion de turistas españoles reservan su viaje ellos mismos es igual a 86.6%

Hipótesis Alternativa: la proporción de turistas españoles que resevan su viaje ellos mismos es diferente a 86.6%

Prueba de proporciones Regla nPi >= 5, n(1-Pi)>=5 3910.866, 3910.134 Cumple la regla

df_spfilt <- df_sp %>%
  filter(Q9 != "")

prop_obs <- sum(df_spfilt$Q9 == "1") / length(df_spfilt$Q9)
prop_esperada <- 0.866
prop.test(x = sum(df_spfilt$Q9 == "1"), n = length(df_spfilt$Q9), p = prop_esperada, alternative= "two.sided")

## 
##  1-sample proportions test with continuity correction
## 
## data:  sum(df_spfilt$Q9 == "1") out of length(df_spfilt$Q9), null probability prop_esperada
## X-squared = 579.16, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.866
## 95 percent confidence interval:
##  0.4002848 0.5009664
## sample estimates:
##         p 
## 0.4501279

4.0.2 Hipótesis 2

PH para una proporción. Casi la mitad de los viajeros en México eligen un destino con la intención de contribuir en la economía de una comunidad local (Gamez, R., 2019). Var Q6_4

Hipótesis Nula: la proporción de turistas mexicanos que fomento el desarrollo local del destino consumiendo productos y servicios locales es mayor o igual al 50%.

Hipótesis Alternativa: la proporción de turistas mexicanos que fomento el desarrollo local del destino consumiendo productos y servicios locales es menor al 50%.

df_spfilt <- filter(df, Q6_4 != "")

prop_obs <- sum(df_spfilt$Q6_4 >= "5") / length(df_spfilt$Q6_4)
prop_esperada <- 0.49
prop.test(x = sum(df_spfilt$Q6_4 >= "5"), n = length(df_spfilt$Q6_4), p = prop_esperada, alternative= "greater")

## 
##  1-sample proportions test with continuity correction
## 
## data:  sum(df_spfilt$Q6_4 >= "5") out of length(df_spfilt$Q6_4), null probability prop_esperada
## X-squared = 85.668, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is greater than 0.49
## 95 percent confidence interval:
##  0.6152795 1.0000000
## sample estimates:
##        p 
## 0.642015

4.0.3 Hipótesis 3

PHp para una proporción. El 55% de los encuestados españoles afirman que, si tuvieran la posibilidad, compensarían la huella de carbono en su alojamiento vacacional (Gamez, R., 2019). Var Q6_11

Hipótesis nula: la proporción de turistas españoles que afirman que compensarían la huella de carbono en su alojamiento vacacional es igual al 55%.

Hipótesis alterna: la proporción de turistas españoles que afirman que compensarían la huella de carbono en su alojamiento vacacional es diferente al 55%

df_spfilt <- filter(df, Q6_11 != "")

prop_obs <- sum(df_spfilt$Q6_11 == "7") / length(df_spfilt$Q6_11)
prop_esperada <- 0.50
prop.test(x = sum(df_spfilt$Q6_11 == "7"), n = length(df_spfilt$Q6_11), p = prop_esperada, alternative= "two.sided")

## 
##  1-sample proportions test with continuity correction
## 
## data:  sum(df_spfilt$Q6_11 == "7") out of length(df_spfilt$Q6_11), null probability prop_esperada
## X-squared = 752.67, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.03762861 0.06694829
## sample estimates:
##          p 
## 0.05037513

4.0.4 Hipótesis 4

PHp para las medias de dos poblaciones normales e independientes. Los mexicanos se desplazan principalmente una vez cada seis meses, es decir, realizan dos viajes al año. Para los españoles la media anual es de 3 viajes (Galván, F, 2017; Piñas, A., 2018). Var Q7

Hipótesis nula: la cantidad promedio de viajes que realizan los mexicanos es igual a la cantidad de viajes que realizan los españoles.

Hipótesis alterna: la cantidad promedio de viajes que realizan los mexicanos es diferente a la cantidad de viajes que realizan los españoles.

prom_viajes_mx <- mean(df_mx$Q7, na.rm=TRUE)
prom_viajes_mx

## [1] 3.80381

t.test(df_mx$Q7, alternative = "two.sided", mu=3, conf.level=0.95)

## 
##  One Sample t-test
## 
## data:  df_mx$Q7
## t = 5.2074, df = 524, p-value = 2.756e-07
## alternative hypothesis: true mean is not equal to 3
## 95 percent confidence interval:
##  3.500569 4.107050
## sample estimates:
## mean of x 
##   3.80381

4.0.5 Hipótesis 5

PHp para una media. El rango de edad en el que se encuentran los turistas mexicanos está entre 25 y 34 años (Procolombia, 2017). Var Q12

Hipótesis nula: El rango de edad en el que se encuentran los turistas mexicanos está entre 25 y 34 años.

Hipótesis alterna: El rango de edad en el que se encuentran los turistas mexicanos no está entre 25 y 34 años.

prom_edad_mx <- mean(df_mx$Q12, na.rm=TRUE)
prom_edad_mx

## [1] 41.31638

t.test(df_mx$Q12, alternative = "two.sided", mu=30, conf.level=0.95)

## 
##  One Sample t-test
## 
## data:  df_mx$Q12
## t = 13.372, df = 530, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 30
## 95 percent confidence interval:
##  39.65389 42.97888
## sample estimates:
## mean of x 
##  41.31638

4.0.6 Hipótesis 6

PHp para una media. El rango de edad en el que se encuentran los turistas vascos está entre 15 y 29 años (Euskadi, 2018). Var Q12

Hipótesis nula: El rango de edad en el que se encuentran los turistas vascos está entre 15 y 29 años.

Hipótesis alterna: El rango de edad en el que se encuentran los turistas vascos no está entre 15 y 29 años.

prom_edad_sp <- mean(df_sp$Q12, na.rm=TRUE)
prom_edad_sp

## [1] 37.05

t.test(df_sp$Q12, alternative = "two.sided", mu=22, conf.level=0.95)

## 
##  One Sample t-test
## 
## data:  df_sp$Q12
## t = 17.561, df = 399, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 22
## 95 percent confidence interval:
##  35.36519 38.73481
## sample estimates:
## mean of x 
##     37.05

5 Conclusión

Garantizar el turismo responsable en un país es crucial para preservar el medio ambiente, proteger la cultura local y promover el desarrollo sostenible. Por ello damos algunas conclusiones:

Dado que nos damos cuenta que aunque muchas mujeres y hombres prefieren planear sus viajes por su cuenta o con la ayuda de otros, es cierto que existen algunas personas que prefieren dejárselo a otros, siendo lo más probable de ello agencias de viajes, por lo que recomendamos que busquen agencias que estén certificadas de alguna manera o especificar que buscan actividades responsables con el ambiente.
Otra medida que creemos que podría apoyar es utilizar medios de transporte colectivos y masivos, como aviones o camiones que ayuden a reducir las emisiones de muchos automóviles por las calles.
Hacer campañas enfocadas a hombres acerca del turismo responsable ya que vemos que se nota un dominio de las mujeres sobre el conocimiento del tema.
Fomentar el turismo local, ya que vemos que la gran mayoría del motivo de los viajes es por ocio o visitas familiares, si logramos que las personas viajen más local tendrán más sentido de pertenencia y de no destruir su localidad, así como reducir su huella de carbono y emisiones.
Involucrar a las comunidades locales en la toma de decisiones sobre el desarrollo turístico en sus áreas.
Promover una variedad de actividades turísticas, como ecoturismo, turismo cultural, turismo de aventura, para reducir la concentración de visitantes en un solo tipo de experiencia.
Implorar a las personas en enfocarse más en los siguientes factores a la hora de planear un viaje:
- Números de desplazamientos necesarios
- Que no haya que invertir mucho tiempo en desplazamientos

Act 3.2

2023-08-31