Se nos presenta una base de datos que tiene el objetivo de conocer en qué medida los viajeros actúan como turistas responsables inspirado en el Manifiesto del viajero responsable propuesto por la Fundación Intermundial, el Instituto de Turismo Responsable, RTI y Biosphere.
Las librerías que se utilizarán son las siguientes (en caso de no tenerlas hay que instalarlas):
library(tidyverse)
library(dplyr)
library(ggplot2)
library(summarytools)
library(readxl)
library(janitor)
library(car)
library(scales)
#file.choose()
df <- read_xlsx("C:\\Users\\usuario\\Documents\\1 Tec\\Módulo 3\\Base de Datos SP Turismo Responsable (1).xlsx", sheet="Datos")
Para tener una noción más amplia de los datos que tenemos utilizaremos la función str() para conocer cada una de las variables con sus datos.
str(df)
## tibble [935 × 59] (S3: tbl_df/tbl/data.frame)
## $ StartDate : POSIXct[1:935], format: "2020-03-05 08:54:01" "2020-03-05 09:03:48" ...
## $ EndDate : POSIXct[1:935], format: "2020-03-05 09:01:58" "2020-03-05 09:05:44" ...
## $ Status : num [1:935] 0 0 0 0 0 0 0 0 0 0 ...
## $ IPAddress : chr [1:935] "131.178.54.55" "131.178.200.66" "200.95.170.77" "131.178.54.69" ...
## $ Progress : num [1:935] 100 100 100 100 100 100 100 100 100 100 ...
## $ Duration (in seconds): num [1:935] 477 115 257 916 255 ...
## $ Finished : num [1:935] 1 1 1 1 1 1 1 1 1 1 ...
## $ RecordedDate : POSIXct[1:935], format: "2020-03-05 09:01:59" "2020-03-05 09:05:44" ...
## $ ResponseId : chr [1:935] "R_1HNq2eWcYHIucIF" "R_3GlhbBuuVXrn7Wa" "R_27Nh8d4iF86rUuK" "R_uf5wi6KfNeBnmal" ...
## $ RecipientLastName : logi [1:935] NA NA NA NA NA NA ...
## $ RecipientFirstName : logi [1:935] NA NA NA NA NA NA ...
## $ RecipientEmail : logi [1:935] NA NA NA NA NA NA ...
## $ ExternalReference : logi [1:935] NA NA NA NA NA NA ...
## $ LocationLatitude : num [1:935] 25.7 25.6 25.7 25.6 25.8 ...
## $ LocationLongitude : num [1:935] -100 -100 -100 -100 -100 ...
## $ DistributionChannel : chr [1:935] "anonymous" "anonymous" "anonymous" "anonymous" ...
## $ UserLanguage : chr [1:935] "EN" "EN" "EN" "EN" ...
## $ Q2 : num [1:935] 1 1 1 1 1 1 2 1 1 2 ...
## $ Q3_1 : num [1:935] 1 1 1 NA 1 1 2 2 2 1 ...
## $ Q3_2 : num [1:935] 2 2 2 NA 3 2 1 3 3 2 ...
## $ Q3_3 : num [1:935] 3 3 3 NA 2 3 3 1 1 3 ...
## $ Q4_1 : num [1:935] 1 1 1 NA 1 1 1 1 NA 1 ...
## $ Q4_2 : num [1:935] NA 1 1 1 1 1 NA 1 1 1 ...
## $ Q4_3 : num [1:935] 1 1 1 1 1 1 1 1 NA 1 ...
## $ Q4_4 : num [1:935] NA 1 NA 1 1 1 1 NA NA NA ...
## $ Q4_5 : num [1:935] NA 1 NA 1 NA NA 1 NA NA NA ...
## $ Q4_6 : num [1:935] 1 1 NA NA 1 1 NA NA NA 1 ...
## $ Q4_7 : num [1:935] NA 1 1 NA 1 1 1 1 1 1 ...
## $ Q4_8 : num [1:935] 1 1 1 1 NA 1 1 NA NA 1 ...
## $ Q4_9 : num [1:935] NA 1 NA 1 NA 1 1 NA NA 1 ...
## $ Q4_10 : num [1:935] NA 1 1 NA 1 1 1 1 1 1 ...
## $ Q4_11 : num [1:935] NA 1 1 1 NA NA NA NA NA NA ...
## $ Q4_12 : num [1:935] 1 1 1 NA NA 1 1 NA NA NA ...
## $ Q6_1 : num [1:935] 4 7 7 5 7 7 5 5 5 5 ...
## $ Q6_2 : num [1:935] 5 6 5 7 5 7 7 5 5 5 ...
## $ Q6_3 : num [1:935] 7 6 5 6 7 7 7 5 5 6 ...
## $ Q6_4 : num [1:935] 4 5 6 5 5 7 7 5 5 7 ...
## $ Q6_5 : num [1:935] 6 5 7 6 6 7 7 4 4 6 ...
## $ Q6_6 : num [1:935] 7 4 7 5 7 7 5 4 3 7 ...
## $ Q6_7 : num [1:935] 7 6 6 7 7 4 4 2 4 5 ...
## $ Q6_8 : num [1:935] 7 7 7 5 7 7 7 7 4 7 ...
## $ Q6_9 : num [1:935] 5 6 7 6 6 7 3 5 4 4 ...
## $ Q6_10 : num [1:935] 6 6 7 5 7 7 3 6 4 2 ...
## $ Q6_11 : num [1:935] 4 6 1 5 3 7 1 1 4 1 ...
## $ Q6_12 : num [1:935] 4 6 3 5 7 7 7 2 4 6 ...
## $ Q6_13 : num [1:935] 5 6 7 6 5 7 3 3 4 2 ...
## $ Q6_14 : num [1:935] 4 5 4 6 5 4 1 3 4 3 ...
## $ Q6_15 : num [1:935] 5 6 5 3 3 2 1 2 4 1 ...
## $ Q6_16 : num [1:935] 7 5 7 7 7 7 4 5 4 4 ...
## $ Q6_17 : num [1:935] 3 6 7 4 5 7 4 6 4 4 ...
## $ Q6_18 : num [1:935] 4 6 4 6 4 2 1 1 4 3 ...
## $ Q7 : num [1:935] 3 4 3 4 2 4 2 20 0 0 ...
## $ Q10 : num [1:935] 1 4 4 4 1 3 1 3 2 1 ...
## $ Q9 : num [1:935] 2 1 3 1 3 1 3 1 2 2 ...
## $ Q12 : num [1:935] 19 22 21 22 21 56 36 23 21 22 ...
## $ Q12_1 : num [1:935] 1 1 1 1 1 4 2 1 1 1 ...
## $ Q11 : num [1:935] 2 1 2 2 2 2 2 2 1 1 ...
## $ Q13 : num [1:935] 1 1 1 1 1 1 1 1 1 1 ...
## $ ...59 : logi [1:935] NA NA NA NA NA NA ...
Removemos los NA de la columna que nos indica en dónde fue realizada la encuesta.
Esto debido a que los registros que no tenemos información acerca de esa pregunta, no podremos segmentarlos, por lo que aunque sería perder esa información, es información que de igual manera sesgaría el análisis.
df <- df[!is.na(df$Q13),]
colnames(df)[which(names(df) == "Duration (in seconds)")] <- "Duration"
De igual manera, removemos las columnas o variables que no aporten algo al análisis, ya sea porque no tienen algun valor o porque su información no sirva para aportar.
df2 <- subset(df, select = -c(Status, RecipientLastName, RecipientFirstName, RecipientEmail, ExternalReference, StartDate, EndDate, IPAddress, RecordedDate, ResponseId, LocationLatitude, LocationLongitude, DistributionChannel, UserLanguage))
En la pregunta 4 nos damos cuenta que los valores NA significa que la persona no le da importancia a esa variable a la hora de armar su viaje, por lo que las vamos a reemplazar por el valor 0 para poder utilizarlo en análisis.
df2 <- df2 %>%
mutate_at(c('Q4_1', 'Q4_2', 'Q4_3', 'Q4_4', 'Q4_5', 'Q4_6', 'Q4_7', 'Q4_8', 'Q4_9', 'Q4_10', 'Q4_11', 'Q4_12'), ~replace_na(.,0))
Ya que tenemos limpia la base de datos que estaremos trabajando, procederemos a la explicación de las variables.
La siguiente gráfica nos permitirá conocer la cantidad de personas que terminaron la encuesta y la cantidad de personas que no la terminaron, esto divido por sexo del encuestado.
t_Finished <- table(df2$Finished, df2$Q11)
colnames(t_Finished) <- c("Hombres", "Mujeres")
rownames(t_Finished) <- c("No terminó", "Terminó")
t_Finished
##
## Hombres Mujeres
## No terminó 43 66
## Terminó 360 464
barplot(t_Finished,
main="Gráfica de finalización de encuesta",
col = c("seagreen4", "palegreen"),
xlab = "Sexo",
ylab = "Frecuencia")
legend(x="topright",
legend=c("No terminó", "Sí terminó"),
fill = c("seagreen4", "palegreen"))
La siguiente gráfica nos permite conocer la proporción de hombres y mujeres que sí han escuchado hablar del turismo responsable.
df_escuchado <- df2[df2$Q2 == 1,]
df_escuchado <- data.frame(
Sexo = df_escuchado$Q11,
Edad = df_escuchado$Q12_1
)
df_escuchado$Sexo[df_escuchado$Sexo == "1"] <- "Hombre"
df_escuchado$Sexo[df_escuchado$Sexo == "2"] <- "Mujer"
head(df_escuchado)
## Sexo Edad
## 1 Mujer 1
## 2 Hombre 1
## 3 Mujer 1
## 4 Mujer 1
## 5 Mujer 1
## 6 Mujer 4
ggplot(df_escuchado, aes(x="", y=Edad, fill = Sexo)) +
geom_bar(stat="identity") +
coord_polar("y", start=0) +
theme_minimal()
La siguiente gráfica nos permite identificar el rango en cuartiles de edad separado por sexo de las personas y separado también por el lugar en el que fue realizada la encuesta.
ggplot(df, aes(x = factor(Q11), y = Q12, fill=factor(Q13))) +
geom_boxplot() +
labs(title = "Age by Gender", x = "Género", y = "Edad") +
scale_x_discrete(labels=c("Hombre", "Mujer")) +
scale_fill_discrete(labels=c("México", "España")) +
theme_minimal()
ggplot(df2, aes(y=Duration, x=Q7)) +
geom_point(aes(col=factor(Q13))) +
geom_smooth(method="loess", se=F) +
xlim(0,75) +
ylim(0,500)
## `geom_smooth()` using formula = 'y ~ x'
ggplot(df2, aes(y=Duration, x=Q7)) +
geom_point(aes(col=factor(Q13))) +
geom_smooth(method="loess", se=F) +
xlim(0,75) +
ylim(0,1000)
## `geom_smooth()` using formula = 'y ~ x'
ggplot(df2, aes(y=Duration, x=Q7)) +
geom_point(aes(col=factor(Q13))) +
geom_smooth(method="loess", se=F) +
xlim(0,75)
## `geom_smooth()` using formula = 'y ~ x'
ggplot(df2, aes(y=Duration, x=Q7)) +
geom_point(aes(col=factor(Q13))) +
geom_smooth(method="lm", se=F) +
xlim(0,75) +
ylim(0,500)
## `geom_smooth()` using formula = 'y ~ x'
ggplot(df2, aes(y=Duration, x=Q7)) +
geom_point(aes(col=factor(Q13))) +
geom_smooth(method="lm", se=F) +
xlim(0,75) +
ylim(0,1000)
## `geom_smooth()` using formula = 'y ~ x'
ggplot(df2, aes(y=Duration, x=Q7)) +
geom_point(aes(col=factor(Q13))) +
geom_smooth(method="lm", se=F) +
xlim(0,75)
## `geom_smooth()` using formula = 'y ~ x'
Las siguiente gráfica nos permitirá identificar los viajes que han realizado los encuestados en los últimos 12 meses.
# Creación los intervalos y asignar etiquetas a los grupos
intervalos <- c(0, 5, 10, 15, Inf) # Define los límites de los intervalos
etiquetas <- c("5 o menos", "Entre 6 y 10", "Entre 11 y 15", "15 o más")
# Etiquetas para los grupos
# Agregar una nueva columna con los grupos
df2$Q7_grupos <- cut(df2$Q7, breaks = intervalos, labels = etiquetas, right = FALSE)
# Creación de la gráfica de barras
ggplot(df2, aes(x = factor(Q7_grupos))) +
geom_bar(fill = c("seagreen4", "seagreen3", "seagreen2", "seagreen1", "black")) +
labs(title = "¿Cuántos viajes haz realizado en el último año?",
x = "Cantidad de viajes", y = "Frecuencia")
gr_q4 <- df2 %>% select(starts_with("Q4"))
gr_q4
## # A tibble: 933 × 12
## Q4_1 Q4_2 Q4_3 Q4_4 Q4_5 Q4_6 Q4_7 Q4_8 Q4_9 Q4_10 Q4_11 Q4_12
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 0 1 0 0 1 0 1 0 0 0 1
## 2 1 1 1 1 1 1 1 1 1 1 1 1
## 3 1 1 1 0 0 0 1 1 0 1 1 1
## 4 0 1 1 1 1 0 0 1 1 0 1 0
## 5 1 1 1 1 0 1 1 0 0 1 0 0
## 6 1 1 1 1 0 1 1 1 1 1 0 1
## 7 1 0 1 1 1 0 1 1 1 1 0 1
## 8 1 1 1 0 0 0 1 0 0 1 0 0
## 9 0 1 0 0 0 0 1 0 0 1 0 0
## 10 1 1 1 0 0 1 1 1 1 1 0 0
## # ℹ 923 more rows
Se hace la sustitución de los valores NA para poder hacer la suma, ya que los 1 significa que sí es un factor que le interese y el NA es que no.
gr_q4[is.na(gr_q4)] <- 0
suma_grq4 <- colSums(gr_q4)
# Creación de una gráfica de barras para mostrar la cantidad de respuestas por opción.
ggplot(data = data.frame(columnas = names(suma_grq4), suma = suma_grq4), aes(x = columnas, y = suma, fill = columnas)) +
geom_bar(stat = "identity") +
labs(title = "Aspectos que se tienen en cuenta al organizar un viaje",
x = "Aspectos",
y = "Suma") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
scale_fill_discrete(guide = FALSE) # Para ocultar la leyenda de colores
## Warning: The `guide` argument in `scale_*()` cannot be `FALSE`. This was deprecated in
## ggplot2 3.3.4.
## ℹ Please use "none" instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
# Crear un vector de colores personalizados y un vector de etiquetas
colores_personalizados <- c("seagreen1", "seagreen3", "seagreen4", "mediumseagreen", "black")
etiquetas_personalizadas <- c("Ocio o visita a familiares", "Estudio", "Trabajo", "Otras razones", "NA")
## Se eliminan espacios en blanco
gr_motivoviajesexo <- df2 %>%
filter(Q9 != "", Q11 != "")
# Gráfico de barras apiladas con colores y etiquetas personalizadas en la leyenda
ggplot(gr_motivoviajesexo, aes(x = factor(Q11), fill = factor(Q10))) +
geom_bar(position = "stack") +
labs(title = "Relación entre Género y Razones de Viaje",
x = "Sexo", y = "Frecuencia",
fill = "Razones de viaje") +
scale_x_discrete(labels = c("Hombre", "Mujer")) +
scale_fill_manual(values = colores_personalizados, labels = etiquetas_personalizadas) + # Cambiar la leyenda
theme_minimal() +
theme(legend.position="right")
# Crear un vector de colores personalizados y un vector de etiquetas
colores_personalizados <- c("seagreen1", "seagreen3", "seagreen4", "mediumseagreen", "black")
etiquetas_personalizadas <- c("Ocio o visita a familiares", "Estudio", "Trabajo", "Otras razones", "NA")
## Se eliminan espacios en blanco
gr_motivoviajesexo <- df2 %>%
filter(Q9 != "", Q11 != "")
# Gráfico de barras apiladas con colores y etiquetas personalizadas en la leyenda
ggplot(gr_motivoviajesexo, aes(x = factor(Q13), fill = factor(Q10))) +
geom_bar(position = "stack") +
labs(title = "Relación entre Género y Razones de Viaje",
x = "País", y = "Frecuencia",
fill = "Razones de viaje") +
scale_x_discrete(labels = c("México", "España")) +
scale_fill_manual(values = colores_personalizados, labels = etiquetas_personalizadas) + # Cambiar la leyenda
theme_minimal() +
theme(legend.position="right")
gr_motivomujeres <- df2 %>% filter(Q10 != "", Q11 != "", Q13 != "")
gr_motivomujeres <- gr_motivomujeres %>% filter(Q11 == "2")
ggplot(gr_motivomujeres, aes(x = factor(Q13), fill = factor(Q10))) +
geom_bar(position = "stack") +
labs(title = "Relación entre Género y Razones de Viaje (Mujeres)",
x = "País", y = "Frecuencia",
fill = "Razones de viaje") +
scale_x_discrete(labels = c("México", "España")) +
scale_fill_manual(values = colores_personalizados, labels = etiquetas_personalizadas) + # Cambiar la leyenda
theme_minimal() +
theme(legend.position="right")
gr_motivohombres <- df2 %>% filter(Q10 != "", Q11 != "", Q13 != "")
gr_motivohombres <- gr_motivohombres %>% filter(Q11 == "1")
ggplot(gr_motivohombres, aes(x = factor(Q13), fill = factor(Q10))) +
geom_bar(position = "stack") +
labs(title = "Relación entre Género y Razones de Viaje (Hombres)",
x = "País", y = "Frecuencia",
fill = "Razones de viaje") +
scale_x_discrete(labels = c("México", "España")) +
scale_fill_manual(values = colores_personalizados, labels = etiquetas_personalizadas) + # Cambiar la leyenda
theme_minimal() +
theme(legend.position="right")
df2 <- df2[!is.na(df2$Q9),]
df2 <- df2[!is.na(df2$Q10),]
df2$Q9 <- as.factor(df2$Q9)
df2$Q11<- as.factor(df2$Q11)
df2$Q10 <- as.factor(df2$Q10)
ggplot(df2, aes(x = Q11, fill = Q10)) +
geom_bar(position = "stack") +
facet_wrap(~ Q9, labeller = labeller(Q9 = c("1" = "Yo", "2" = "Otros", "3" = "Yo y Otros"))) +
labs(title = "¿Quién planea el viaje?",
x = "Rango de Edad", y = "Cantidad") +
scale_fill_manual(values = c("seagreen1", "seagreen3", "seagreen4", "mediumseagreen", "black"), name = "Razón Viaje", labels = c("1" = "Ocio o Visita", "2" = "Estudio", "3" = "Trabajo", "4" = "Otro")) +
scale_x_discrete(name = "Sexo", labels = c("1" = "Hombres", "2" = "Mujeres")) +
scale_colour_discrete(na.translate = F)
Seleccionamos las columnas que vayamos a poder utilizar en las pruebas y observamos las variables con NAs para ver la factibilidad de eliminarlos.
df <- df %>% select(starts_with("Q"))
na_values <- colSums(is.na(df))
print(na_values)
## Q2 Q3_1 Q3_2 Q3_3 Q4_1 Q4_2 Q4_3 Q4_4 Q4_5 Q4_6 Q4_7 Q4_8 Q4_9
## 0 79 79 79 115 233 398 561 562 433 327 453 500
## Q4_10 Q4_11 Q4_12 Q6_1 Q6_2 Q6_3 Q6_4 Q6_5 Q6_6 Q6_7 Q6_8 Q6_9 Q6_10
## 444 695 392 0 0 0 0 0 0 0 0 0 0
## Q6_11 Q6_12 Q6_13 Q6_14 Q6_15 Q6_16 Q6_17 Q6_18 Q7 Q10 Q9 Q12 Q12_1
## 0 0 0 0 0 0 0 0 12 13 11 2 0
## Q11 Q13
## 0 0
Viendo que eliminar los NAS eliminaría demasiado registros, lo vemos como algo no factible.
Separamos la base de datos por países.
df_mx <- df[df$Q13 == 1,]
df_sp <- df[df$Q13 == 2,]
PH para una proporción. El (86.6%) de los españoles reservan su viaje por internet ellos mismos (Acosta, E., 2019). Var Q9.
Hipótesis Nula: la proporcion de turistas españoles reservan su viaje ellos mismos es igual a 86.6%
Hipótesis Alternativa: la proporción de turistas españoles que resevan su viaje ellos mismos es diferente a 86.6%
Prueba de proporciones Regla nPi >= 5, n(1-Pi)>=5 3910.866, 3910.134 Cumple la regla
df_spfilt <- df_sp %>%
filter(Q9 != "")
prop_obs <- sum(df_spfilt$Q9 == "1") / length(df_spfilt$Q9)
prop_esperada <- 0.866
prop.test(x = sum(df_spfilt$Q9 == "1"), n = length(df_spfilt$Q9), p = prop_esperada, alternative= "two.sided")
##
## 1-sample proportions test with continuity correction
##
## data: sum(df_spfilt$Q9 == "1") out of length(df_spfilt$Q9), null probability prop_esperada
## X-squared = 579.16, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.866
## 95 percent confidence interval:
## 0.4002848 0.5009664
## sample estimates:
## p
## 0.4501279
PH para una proporción. Casi la mitad de los viajeros en México eligen un destino con la intención de contribuir en la economía de una comunidad local (Gamez, R., 2019). Var Q6_4
Hipótesis Nula: la proporción de turistas mexicanos que fomento el desarrollo local del destino consumiendo productos y servicios locales es mayor o igual al 50%.
Hipótesis Alternativa: la proporción de turistas mexicanos que fomento el desarrollo local del destino consumiendo productos y servicios locales es menor al 50%.
df_spfilt <- filter(df, Q6_4 != "")
prop_obs <- sum(df_spfilt$Q6_4 >= "5") / length(df_spfilt$Q6_4)
prop_esperada <- 0.49
prop.test(x = sum(df_spfilt$Q6_4 >= "5"), n = length(df_spfilt$Q6_4), p = prop_esperada, alternative= "greater")
##
## 1-sample proportions test with continuity correction
##
## data: sum(df_spfilt$Q6_4 >= "5") out of length(df_spfilt$Q6_4), null probability prop_esperada
## X-squared = 85.668, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is greater than 0.49
## 95 percent confidence interval:
## 0.6152795 1.0000000
## sample estimates:
## p
## 0.642015
PHp para una proporción. El 55% de los encuestados españoles afirman que, si tuvieran la posibilidad, compensarían la huella de carbono en su alojamiento vacacional (Gamez, R., 2019). Var Q6_11
Hipótesis nula: la proporción de turistas españoles que afirman que compensarían la huella de carbono en su alojamiento vacacional es igual al 55%.
Hipótesis alterna: la proporción de turistas españoles que afirman que compensarían la huella de carbono en su alojamiento vacacional es diferente al 55%
df_spfilt <- filter(df, Q6_11 != "")
prop_obs <- sum(df_spfilt$Q6_11 == "7") / length(df_spfilt$Q6_11)
prop_esperada <- 0.50
prop.test(x = sum(df_spfilt$Q6_11 == "7"), n = length(df_spfilt$Q6_11), p = prop_esperada, alternative= "two.sided")
##
## 1-sample proportions test with continuity correction
##
## data: sum(df_spfilt$Q6_11 == "7") out of length(df_spfilt$Q6_11), null probability prop_esperada
## X-squared = 752.67, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
## 0.03762861 0.06694829
## sample estimates:
## p
## 0.05037513
PHp para las medias de dos poblaciones normales e independientes. Los mexicanos se desplazan principalmente una vez cada seis meses, es decir, realizan dos viajes al año. Para los españoles la media anual es de 3 viajes (Galván, F, 2017; Piñas, A., 2018). Var Q7
Hipótesis nula: la cantidad promedio de viajes que realizan los mexicanos es igual a la cantidad de viajes que realizan los españoles.
Hipótesis alterna: la cantidad promedio de viajes que realizan los mexicanos es diferente a la cantidad de viajes que realizan los españoles.
prom_viajes_mx <- mean(df_mx$Q7, na.rm=TRUE)
prom_viajes_mx
## [1] 3.80381
t.test(df_mx$Q7, alternative = "two.sided", mu=3, conf.level=0.95)
##
## One Sample t-test
##
## data: df_mx$Q7
## t = 5.2074, df = 524, p-value = 2.756e-07
## alternative hypothesis: true mean is not equal to 3
## 95 percent confidence interval:
## 3.500569 4.107050
## sample estimates:
## mean of x
## 3.80381
PHp para una media. El rango de edad en el que se encuentran los turistas mexicanos está entre 25 y 34 años (Procolombia, 2017). Var Q12
Hipótesis nula: El rango de edad en el que se encuentran los turistas mexicanos está entre 25 y 34 años.
Hipótesis alterna: El rango de edad en el que se encuentran los turistas mexicanos no está entre 25 y 34 años.
prom_edad_mx <- mean(df_mx$Q12, na.rm=TRUE)
prom_edad_mx
## [1] 41.31638
t.test(df_mx$Q12, alternative = "two.sided", mu=30, conf.level=0.95)
##
## One Sample t-test
##
## data: df_mx$Q12
## t = 13.372, df = 530, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 30
## 95 percent confidence interval:
## 39.65389 42.97888
## sample estimates:
## mean of x
## 41.31638
PHp para una media. El rango de edad en el que se encuentran los turistas vascos está entre 15 y 29 años (Euskadi, 2018). Var Q12
Hipótesis nula: El rango de edad en el que se encuentran los turistas vascos está entre 15 y 29 años.
Hipótesis alterna: El rango de edad en el que se encuentran los turistas vascos no está entre 15 y 29 años.
prom_edad_sp <- mean(df_sp$Q12, na.rm=TRUE)
prom_edad_sp
## [1] 37.05
t.test(df_sp$Q12, alternative = "two.sided", mu=22, conf.level=0.95)
##
## One Sample t-test
##
## data: df_sp$Q12
## t = 17.561, df = 399, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 22
## 95 percent confidence interval:
## 35.36519 38.73481
## sample estimates:
## mean of x
## 37.05
Garantizar el turismo responsable en un país es crucial para preservar el medio ambiente, proteger la cultura local y promover el desarrollo sostenible. Por ello damos algunas conclusiones: