turismo <- read.csv("/Users/benjaminreyessanchez/Downloads/Base de datos turismo limpia")

library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.1     ✔ readr     2.1.4
## ✔ forcats   1.0.0     ✔ stringr   1.5.0
## ✔ ggplot2   3.4.1     ✔ tibble    3.2.1
## ✔ lubridate 1.9.2     ✔ tidyr     1.3.0
## ✔ purrr     1.0.1     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(dplyr)
library(ggplot2)

Análisis Descriprivo

Conocimiento Sobre el Turismo Responsable Por Edades

tab_edad <- table(turismo$Q2,turismo$Q12_1)
tab_edad
##    
##       1   2   3   4   5
##   1 164  91  96  52  36
##   2 102  46  53  42  47
barplot(tab_edad, main = "Conocimiento Turismo Responsable", xlab = "Edades", ylab = "Frecuencia", names.arg=c("< 25","25 - 40", "40 - 55", "55 - 65", "> 65"))
legend(x="topright", legend=c("Sí", "No"), fill = c("Black","Grey"))

Aspectos Importantes del Turismo Responsable

op3.1 <- count(turismo, Q3_1)
op3.2 <- count(turismo, Q3_2)
op3.3 <- count(turismo, Q3_3)

names(op3.1) <- c("R", "Acciones y Normativas")
names(op3.2) <- c("R", "Alteración Entorno Social")
names(op3.3) <- c("R", "Equidad/Justicia Laboral")

op3.1
##   R Acciones y Normativas
## 1 1                   356
## 2 2                   255
## 3 3                   118
op3.2
##   R Alteración Entorno Social
## 1 1                       235
## 2 2                       225
## 3 3                       269
op3.3
##   R Equidad/Justicia Laboral
## 1 1                      138
## 2 2                      249
## 3 3                      342
resultadoQ3 <- merge(op3.1, op3.2, by = "R", all = TRUE) # Unir df1 y df2
resultadoQ3 <- merge(resultadoQ3, op3.3, by = "R", all = TRUE) # Unir df3 al resultado anterior
resultadoQ3$R <- as.factor(resultadoQ3$R)
barplot(as.matrix(resultadoQ3[, 2:4]), beside = TRUE, col = c("dodgerblue3", "darkorchid3", "darkorange2"),
        legend.text = rownames(df), ylim = c(0, 400),
        main = "Aspectos del Turismo Responsable", xlab = "Categorías", ylab = "Valores")
legend(x="bottomright", legend=c("1", "2", "3"), fill = c("dodgerblue3","darkorchid3", "darkorange2"))

Aspectos en Cuenta para Organizar un Viaje

p4.1 <- sum(turismo$Q4_1)
p4.2 <- sum(turismo$Q4_2)
p4.3 <- sum(turismo$Q4_3)
p4.4 <- sum(turismo$Q4_4)
p4.5 <- sum(turismo$Q4_5)
p4.6 <- sum(turismo$Q4_6)
p4.7 <- sum(turismo$Q4_7)
p4.8 <- sum(turismo$Q4_8)
p4.9 <- sum(turismo$Q4_9)
p4.10 <- sum(turismo$Q4_10)
p4.11 <- sum(turismo$Q4_11)
p4.12 <- sum(turismo$Q4_12)

p4.1
## [1] 641
p4.2
## [1] 557
p4.3
## [1] 437
p4.4
## [1] 291
p4.5
## [1] 310
p4.6
## [1] 395
p4.7
## [1] 467
p4.8
## [1] 392
p4.9
## [1] 362
p4.10
## [1] 392
p4.11
## [1] 193
p4.12
## [1] 429
df_valores <- data.frame(Categoria = c("Costo", "Seguridad", "Oferta Turística", "Nº Desplazamientos", "T Desplazamientos", "Transporte Disponible", "Conocer Cultura", "Conocer Parajes", "Gastronomía", "Recomendaciones", "Exclusividad", "Temporada Año"), Suma = c(p4.1, p4.2, p4.3, p4.4, p4.5, p4.6, p4.7, p4.8, p4.9, p4.10, p4.11, p4.12))
ggplot(df_valores, aes(x = Categoria, y = Suma)) +
  geom_bar(stat = "identity", fill = "blue") +
  geom_text(aes(label = Suma), vjust = -0.3, size = 3) +
  labs(title = "Aspectos en Cuenta para Organizar un Viaje", x = "Categoría", y = "Frecuencia") +
  theme_minimal() +
  theme(axis.text.x = element_text(size = 10, angle = 30, hjust = 1))

Afirmaciones Relacionadas a su Modo de Actuar

Preocupación por la Sostenibilidad

plot(x = factor(turismo$Q12_1), y = turismo$Q6_1, main = "Preocupación por la Sostenibilidad", xlab = "Rango de Edad", ylab = "Nivel de Preocupación", col = c("cadetblue2", "cadetblue3", "cadetblue4", "cadetblue2", "cadetblue3"))
legend(x="bottomleft", legend=c("< 25","25 - 40", "40 - 55", "55 - 65", "> 65"), fill = c("cadetblue2", "cadetblue3", "cadetblue4", "cadetblue2", "cadetblue3"))

Consciencia de Riesgos al Viajar

plot(x = factor(turismo$Q11), y = turismo$Q6_2, main = "Consciencia de Riesgos al Viajar", xlab = "Sexo", ylab = "Nivel de Consciencia", col = c("chartreuse4", "chocolate"),names.arg=c("Hombre","Mujer"))
legend(x="bottomleft", legend=c("Hombre", "Mujer"), fill = c("chartreuse4","chocolate"))

Fomento del Desarrollo Local

plot(x = factor(turismo$Q13), y = turismo$Q6_4, main = "Fomento del Desarrollo Local", xlab = "Nacionalidad", ylab = "Nivel de Afirmación", col = c("darkcyan", "darkgoldenrod"),names.arg=c("Hombre","Mujer"))
legend(x="bottomleft", legend=c("México", "España"), fill = c("darkcyan","darkgoldenrod"))

Cálculo de la Huella de Carbono de su Viaje

plot(x = factor(turismo$Q13), y = turismo$Q6_11, main = "Cálculo de la Huella de Carbono de su Viaje", xlab = "Nacionalidad", ylab = "Nivel de Responsabilidad", col = c("purple", "green3"),names.arg=c("Hombre","Mujer"))
legend(x="topleft", legend=c("México", "España"), fill = c("purple","green3"))

Participación en Redes y Actividades relacionadas al Turismo Sostenible

plot(x = factor(turismo$Q12_1), y = turismo$Q6_15, main = "Participación en Redes y Actividades Relacionadas", xlab = "Rango de Edad", ylab = "Nivel de Participación", col = c("antiquewhite2", "antiquewhite3", "antiquewhite4", "antiquewhite3", "antiquewhite2"))
legend(x="topright", legend=c("< 25","25 - 40", "40 - 55", "55 - 65", "> 65"), fill = c("antiquewhite2", "antiquewhite3", "antiquewhite4", "antiquewhite3", "antiquewhite2"))

Número de viajes realizados en el último año, Razones y Planificación

hist(x = turismo$Q7, main = "Histograma - Nº de Viajes del Último Año", col = "forestgreen", xlab = "Nº de Viajes", ylab = "Frecuencia", xlim = c(0, 30))

turismo$Q9 <- as.factor(turismo$Q9)
turismo$Q12_1 <- as.factor(turismo$Q12_1)
turismo$Q10 <- as.factor(turismo$Q10)

ggplot(turismo, aes(x = Q12_1, fill = Q10)) +
  geom_bar(position = "stack") +
  facet_wrap(~ Q9, labeller = labeller(Q9 = c("1" = "Yo", "2" = "Otros", "3" = "Yo y Otros"))) +
  labs(title = "Planificación del Viaje Relacionado a la Razón del Viaje y Edad",
       x = "Rango de Edad", y = "Cantidad") +
  scale_fill_manual(values = c("steelblue4", "royalblue1", "skyblue3", "royalblue4"),
                    name = "Razón Viaje", labels = c("1" = "Ocio o Visita", "2" = "Estudio", "3" = "Trabajo", "4" = "Otro")) +
  scale_x_discrete(name = "Rango de Edad", labels = c("1" = "< 25", "2" = "25 - 40", "3" = "40 - 55", "4" = "55 - 65", "5" = "> 65")) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Hipótesis

base <- turismo
españa <- base[base$Q13 == 2,]
mexico <- base[base$Q13 == 1,]

Hipotesis 1; Hipotesis Alterna

q9 <- as.numeric(españa$Q9)

q9data <- sum(q9 == 1) / length(q9)

hipotesis1 <- 0.866

##res1 <- t.test(q9data, alternative = "two.sided", conf.level = 0.95, mu = hipotesis1)

Hipotesis 2; Hipotesis Alterna

q6 <- as.numeric(mexico$Q6_4)

q6data <- mean(q6)
hipotesis2 <- .50
res2 <- t.test(q6, alternative = "less", conf.level = 0.95, mu = hipotesis2)
res2
## 
##  One Sample t-test
## 
## data:  q6
## t = 58.055, df = 441, p-value = 1
## alternative hypothesis: true mean is less than 0.5
## 95 percent confidence interval:
##      -Inf 5.111478
## sample estimates:
## mean of x 
##  4.984163

Hipotesis 3; Hipotesis Alterna

q611 <- as.numeric(españa$Q6_11)

q6media <- mean(q611)

hipotesis3 <- 0.55

res3 <- t.test(q611, alternative = "less", conf.level = 0.95, mu = hipotesis3)
res3
## 
##  One Sample t-test
## 
## data:  q611
## t = 17.828, df = 286, p-value = 1
## alternative hypothesis: true mean is less than 0.55
## 95 percent confidence interval:
##      -Inf 2.667168
## sample estimates:
## mean of x 
##  2.487805

Hipotesis4; Hipotesis Alterna

vmex <- mexico$Q7
vesp <- españa$Q7

res4 <- t.test(vmex, vesp)
res4
## 
##  Welch Two Sample t-test
## 
## data:  vmex and vesp
## t = 0.2395, df = 457.41, p-value = 0.8108
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.6081497  0.7769579
## sample estimates:
## mean of x mean of y 
##  3.753394  3.668990

Hipotesis 5; Hipotesis Alterna

q12 <- as.numeric(mexico$Q12)

hipotesis5 <- c(25, 36)

res5 <- t.test(q12, mu = mean(hipotesis5), conf.level = 0.95)
res5
## 
##  One Sample t-test
## 
## data:  q12
## t = 11.309, df = 441, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 30.5
## 95 percent confidence interval:
##  39.19774 42.85656
## sample estimates:
## mean of x 
##  41.02715

Hipotesis6; Hipotesis Alterna

q12 <- as.numeric(españa$Q12)

hipotesis6 <- c(15,29)

res6 <- t.test(q12, mu = mean(hipotesis6), conf.level = 0.95)
res6
## 
##  One Sample t-test
## 
## data:  q12
## t = 14.223, df = 286, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 22
## 95 percent confidence interval:
##  34.58792 38.63159
## sample estimates:
## mean of x 
##  36.60976
