Título

Autor

Estudiante

Última modificación

6 de noviembre de 2024

Actividad 1: Asociaciones causales (30%)

Busca en internet (prensa, twitter/x, etc.) una asociación causal que consideres problemática y se haya publicado durante los últimos 6 meses. Coméntala en el foro de acuerdo con los principales elementos que aparecen en el módulo de esta unidad.

En la actividad que publiques en el foro:

Sube un video (máximo 1’30 minutos) en el que expliques brevemente la asociación causal que se ha formulado, la fuente donde la encontraste y la problemática que encuentras. Se valorará principalmente el razonamiento que hagas sobre por qué es problemática. En el texto de tu publicación, incluye la información que creas necesaria sobre la fuente: enlace, captura de pantalla, etc. Es importante que sea algo de actualidad. Da “like” a tres publicaciones de otros estudiantes que te hayan gustado.

Actividad 2: Correlaciones (30%)

Juega a “Guess the Correlation” (ejercicio 1.2 del módulo).

Para jugar, entra con tu usuario de la UOC.
Puedes jugar tantas veces como quieras.
Entrega una captura de pantalla del menú principal del juego, donde se vea la puntuación y tu nombre de usuario de la UOC (lo que aparece antes de la @ en tu correo electrónico).

Ejemplo:

Actividad 3: Azar (15%)

De acuerdo con lo que has aprendido en el módulo, utiliza R para lanzar una moneda al aire 100 veces y guarda el resultado como el objeto a. Repite el procedimiento y guarda el resultado como el objeto b.

set.seed(242) #esta función te sirve para "fijar" el azar, lo que nos viene bien para el propósito del ejercicio ya que los resultados serán replicables (más info: https://r-coder.com/set-seed-r/?utm_content=cmp-true)
a <- sample(c("Cara", "Cruz"), 250, replace = TRUE)
b <- sample(c("Cara", "Cruz"), 250, replace = TRUE)
table(a)

a
Cara Cruz 
 136  114

table(b)

b
Cara Cruz 
 120  130

Supón que el intervalo de confianza al 95% tiene un valor de 14.31. Comenta los resultados (máx. 200 palabras):

¿Cuál es el resultado de cada caso? ¿Cuál es la hipótesis nula? ¿Y la hipótesis alternativa? ¿Crees que algún estudiante obtendrá diferencias significativas entre cara y cruz?

Actividad 4: Causalidad (15%) Queremos hacer un experimento sociológico con una población de 50 personas relacionado con las percepciones de seguridad. Para ello, hemos recopilado previamente datos de estos individuos, como la edad, el género, el nivel educativo, la orientación política y la variable clave: cuál es su percepción de seguridad en su barrio. Examina, en primer lugar, el marco de datos:

datos <- read_rds("r4.rds")

Como vemos, hay una cierta variación entre los individuos cuando se les pregunta sobre la seguridad en su barrio: “valore, del 0 al 10, si usted cree que su barrio es seguro, siendo 0 muy inseguro y 10 muy seguro”.

Nuestro experimento consiste en exponer a la mitad de los encuestados (grupo de tratamiento) a datos que muestran que en su barrio hay pocos delitos en comparación con otros barrios. Y a la otra mitad (grupo de control) no los expondremos a ninguna información. Más adelante, enviaremos un vendedor de alarmas para el hogar a la casa de los 50 individuos y veremos si en el primer grupo se han vendido menos alarmas que en el segundo.

Sin embargo, antes de realizar el experimento, necesitamos separar a estos 50 individuos en dos grupos aleatorios, en los que la percepción de seguridad del primer grupo sea igual a la del segundo. Una opción sería poner en el grupo de tratamiento a los primeros 25 individuos de la lista y en el segundo grupo a los últimos 25, pero pensamos que tal vez esto sesgue los datos. Esto es lo que miramos de hacer en el siguiente código, en el que hemos creado la variable grupo, que toma el valor 1 para los primeros 25 individuos y el valor 2 para los últimos 25.

datos |> 
  mutate(grupo = rep(c("1", "2"), length.out = n(), each = 25),
         grupo_random = sample(c("1", "2"), n(), replace = T)) |>
  ggplot(aes(x = grupo, y = seguridad)) +
  geom_jitter(width = 0.2, alpha = 0.1) +
  stat_summary(fun.data = mean_se,
               fun.args = list(mult = 1.96), 
               size = 0.2, colour = "red")

Responde a las siguientes preguntas:

Describe el gráfico, cuando separamos los individuos por la variable grupo. Formula una explicación de por qué crees que obtienes este resultado.
Copia todo el código en un nuevo chunk y modifícalo, utilizando esta vez la variable grupo_random, en la que cada individuo es asignado al azar en un grupo u otro. Haz una descripción del gráfico.
En teoría, las características de los individuos deberían ser, en promedio, muy similares en cada grupo. Compruébalo, en el caso del género, con el siguiente código, y describe los resultados y sus implicaciones.

datos |> 
  mutate(grupo = rep(c("1", "2"), length.out = n(), each = 25),
         grupo_random = sample(c("1", "2"), n(), replace = T)) |>
  ggplot(aes(x = grupo, y = seguridad, col = genero)) +
  geom_jitter(width = 0.2, alpha = 0.1) +
  stat_summary(fun.data = mean_se,
               fun.args = list(mult = 1.96), 
               size = 0.2,
               position = position_dodge(0.2))

NOTA: Debes entregar tres gráficos, uno para cada respuesta (a, b, c).

Actividad 5: Modelos

Observa esta relación entre las capacidades materiales de un estado y la intensidad de las relaciones diplomáticas. Las capacidades materiales se miden con el índice CINC, que indica el poder material relativo de un estado en un año determinado (0 sería que no tiene ningún poder y 1 que tiene mucho poder). La intensidad de las relaciones diplomáticas se mide por el número de embajadas recibidas en un país (0 si no tiene ninguna embajada, 1 si tiene embajadas de todos los países).

Piensa cuál puede ser la pendiente y el intercepto y crea con ggplot2 un gráfico con la recta de regresión (ayúdate de lo que encontrarás en el siguiente chunk).
Crea la fórmula que te permita estimar la intensidad de las relaciones diplomáticas de un estado en función de sus capacidades materiales.
Calcula la intensidad de las relaciones diplomáticas de un estado que puntúa 0.35 en el índice CINC.
Finalmente, discute la relación entre las dos variables, en términos causales.

datos |> 
  ggplot(aes(x = 0, y = 1)) +
  geom_abline(intercept = 0 , slope = 1, col = "blue") +
  lims(x = c(0,1), y = c(0,1))