<- sample(c("Cara", "Cruz"), 100, replace = TRUE)
a <- sample(c("Cara", "Cruz"), 100, replace = TRUE)
b table(a)
a
Cara Cruz
45 55
table(b)
b
Cara Cruz
44 56
<- sample(c("Cara", "Cruz"), 100, replace = TRUE)
a <- sample(c("Cara", "Cruz"), 100, replace = TRUE)
b table(a)
a
Cara Cruz
45 55
table(b)
b
Cara Cruz
44 56
El primer resultado ha sido de 39 y 61, con una inclinación hacia “Cruz”, pero aun así relativamente equilibrado, y el segundo de 50 y 50, las dos mitades perfectas. La hipótesis nula es que los resultados han sido puramente una cuestión de azar, con ambos lados teniendo una posibilidad del 50% de salir, mientras que la hipóptesis alternativa sería que haya una diferencia en las probabilidades de que salga una moneda u otra, lo que indicaría que la moneda está trucada. Esta segunda hipótesis se pudo haber apoyado en el objeto a, pero al ser el objeto b un resultado exacto de una probabilidad de 0.5, se desmiente, quedando la hipótesis nula. Así, nadie debería tener una diferencia significativa entre cara y cruz si lanza la moneda muchas veces; pero siempre existe la posibilidad, por ridícula que sea. (150 palabras)
<- read_rds("r4_es.rds") datos
|>
datos mutate(grupo = rep(c("1", "2"), length.out = n(), each = 25),
grupo_random = sample(c("1", "2"), n(), replace = T)) |>
ggplot(aes(x = grupo, y = seguridad)) +
geom_jitter(width = 0.2, alpha = 0.1) +
stat_summary(fun.data = mean_se,
fun.args = list(mult = 1.96),
size = 0.2, colour = "red")
El grupo 1 tiene respuestas más dispersas pero con una concentración mayor entre valores bajos de seguridad, alrededor de 3 a 5, mientras que el grupo 2 presenta respuestas más concentradas en valores altos, entre 7 y 8, y hay un pequeño número de valores extremos hacia el 10. Por otra parte, la media de percepción de seguridad en el grupo 1 parece más baja que en el grupo 2, según la posición de las líneas rojas. Los intervalos de confianza muestran poca superposición, lo que sugiere una diferencia significativa entre ambos grupos. Esto se debe probablemente a la división de los mismos, ya que nos basamos en el orden de la recogida de los datos y no garantizamos aleatoriedad; esto produce un sesgo.
|>
datos mutate(grupo = rep(c("1", "2"), length.out = n(), each = 25),
grupo_random = sample(c("1", "2"), n(), replace = T)) |>
ggplot(aes(x = grupo_random, y = seguridad)) +
geom_jitter(width = 0.2, alpha = 0.1) +
stat_summary(fun.data = mean_se,
fun.args = list(mult = 1.96),
size = 0.2, colour = "red")
Los datos en este segundo gráfico están más equilibrados que en el primero, y los puntos individuales muestran una dispersión similar en ambas categorías. Además, la media de seguridad es muy similar, y los intervalos de confianza se superponen completamente, no mostrando mucha diferencia entre ambos grupos; esto se puede deber a que, ahora sí, hemos eliminado el sesgo presente por la división anterior de los datos basada en el orden de recogida.
|>
datos mutate(grupo = rep(c("1", "2"), length.out = n(), each = 25),
grupo_random = sample(c("1", "2"), n(), replace = T)) |>
ggplot(aes(x = grupo, y = seguridad, col = genero)) +
geom_jitter(width = 0.2, alpha = 0.1) +
stat_summary(fun.data = mean_se,
fun.args = list(mult = 1.96),
size = 0.2,
position = position_dodge(0.2))
Si nos centramos en las diferencias de género del grupo uno, se parecia que los hombres tienen una sensación de seguridad ligeramente superior a la de las mujeres. Esto se puede deber a factores socioculturales, que vienen a raíz del machismo o los denominados crímenes de género. Aun así, los intervalos de respuesta son relativamente amplios, indicando variabilidad en sus respuestas, especialmente en el caso de las mujeres. En el grupo 2, hay una mayor sensación de seguridad, llevando los hombres de nuevo la delantera. En general, las mujeres tienen una menor sensación de seguridad, pero no hay una gran diferencia con respecto a la de los hombres y ambos géneros muestran una amplia variabilidad en sus respuestas.
En el gráfico presentado podemos observar una pendiente de casi 1, indicando que por cada incremento en 0.1 en CINC, también habrá un aumento similar de las relaciones diplomáticas, teniendo una relación lineal positiva. Adicionalmente, el intercepto inicial está muy cerca de 0, por lo que un país sin capacidades materiales tampoco tendrá capacidades diplomáticas. La fórmula en este caso sería de prácticamente X = Y, por o que un país que tiene un índice CINC de 0.35, tendrá unas relaciones diplomáticas de aproximadamente 0.35 también. La relación entre ambas variables parece ser de causalidad positiva, posiblemente por el atractivo que supone tener poderes materiales; pero podría ser una causalidad indirecta, ya que otros factores podrían entrar en juego, como su estabilidad, influencia o alianzas. Podría ser un caso de falsa causalidad, y que más bien solo haya una correlación.
|>
datos ggplot(aes(x = 0, y = 1)) +
geom_abline(intercept = 0 , slope = 1, col = "blue") +
lims(x = c(0,1), y = c(0,1))