Activitat 4

Autor

Cristina Martínez Jaumejoan

Última modificació

15 de desembre de 2025

Exercici 1: Associacions causals (30%)

Resposta al fòrum.

Recentment, Vox ha atribuït l’estancament dels salaris i el deteriorament de les condicions laborals a la immigració. El partit argumenta que els treballadors estrangers han ocupat una part important dels nous llocs de treball des del 2022 i que això genera competència a la baixa en els sectors menys qualificats. Tot i presentar dades descriptives, aquesta afirmació és problemàtica perquè confon associació amb causalitat, no explicita un mecanisme causal clar, no controla variables de confusió rellevants i no té en compte la incertesa estadística, tal com assenyala el mòdul.

Aquesta notícia l’ha publicada Europa Press, i la podem trobar en l’enllaç següent:

Font: Europa Press – Vox culpa a la inmigración del estancamiento de los salarios

Exercici 2: Correlacions (15%)

El meu High Score al joc “Guess the Correlation”.

Exercici 3: Atzar (15%)

Utilitzem R per llençar un dau de sis cares 10.000 vegades i desem el resultat com l’objecte dau1.

Veiem els resultats de cada una de les tirades en una taula, i posteriorment hem creat un histograma per a representar-les gràficament.

dau1
   1    2    3    4    5    6 
1621 1599 1648 1680 1737 1715 

Si el dau té 6 cares, quina és la probabilitat que surti cada cara?
Un procés aleatori és aquell en què no podem predir el resultat individual, però sí descriure el comportament del conjunt mitjançant probabilitats. El llançament d’un dau equilibrat és un exemple clàssic de procés aleatori (Mas, Vall, 2023).
Si el dau té sis cares i és equilibrat, la probabilitat teòrica que surti cadascuna de les cares és la mateixa: 1/6, que equival aproximadament a un 16,67%. Aquesta probabilitat és la que esperaríem abans d’observar cap resultat.

Quin ha estat el resultat de la simulació que hem fet? Són molt diferents?
En la simulació realitzada amb R, s’ha llençat el dau 10.000 vegades. Els resultats mostren que les freqüències observades per a cada cara són similars entre si i properes al valor teòric del 16,67%, tot i que no són exactament iguals. Aquestes diferències són normals i esperables en un procés aleatori amb un nombre finit d’observacions.

Creus que el dau està trucat? Argumenta les teves respostes.
Tal com explica el mòdul (Mas, Vall, 2023), aquesta variabilitat és conseqüència de l’atzar i no implica que el procés sigui incorrecte. A més, el mòdul assenyala que, a mesura que augmenta el nombre de repeticions, les freqüències empíriques tendeixen a aproximar-se a les probabilitats teòriques, d’acord amb la llei dels grans nombres. En aquest cas, amb 10.000 llançaments, aquesta aproximació ja és clarament visible.
Per tant, els resultats de la simulació són coherents amb el que prediu el mòdul per a un procés aleatori equilibrat i no hi ha indicis que el dau estigui trucat. Les petites diferències observades responen únicament a la incertesa pròpia de l’atzar.

Exercici 4: Causalitat (40%)

Volem fer un experiment sociològic amb una població de 1000 persones relacionat amb les percepcions de preocupació per la política i fins a quin punt es veuen influenciades per estar exposades a notícies sobre corrupció. Per això, hem recopilat prèviament dades d’aquests individus, com l’edat, el gènere, el nivell educatiu, la ideologia (de 0 a 10, sent 0 extrema esquerra i 10 extrema dreta) i la variable clau: quin és el seu nivell de preocupació per la política.

El nostre experiment consisteix a exposar la meitat dels enquestats (grup de tractament, variable grupo=1) a una notícia en què s’explica que hi ha hagut diversos casos de corrupció a Espanya, mentre que al grup de control (grupo = 0) no els exposem a cap informació.

En primer lloc, carreguem i examinem el marc de dades:

#Pas 1: Carregar el marc de dades 
dades <- read_rds("datos_r4.rds")

#Pas 2: Examinar el marc de dades
#Identifiquem el nombre d’observacions,les variables disponibles i el tipus de cada variable.
glimpse(dades)
Rows: 1,000
Columns: 9
$ id                    <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 1…
$ edad                  <dbl> 56, 38, 65, 45, 75, 51, 54, 47, 61, 52, 72, 81, …
$ genero                <chr> "Mujer", "Hombre", "Mujer", "Mujer", "Mujer", "H…
$ educacion             <fct> Primarios, Sin estudios, Universitarios, Univers…
$ estado_laboral        <fct> Estudiante, Parado, Jubilado, Jubilado, Ocupado,…
$ ingresos              <dbl> 82774, 21659, 47603, 37074, 21891, 71778, 49864,…
$ ideologia             <int> 6, 8, 5, 6, 7, 5, 6, 7, 0, 7, 4, 10, 2, 5, 4, 5,…
$ grupo                 <fct> 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, …
$ preocupacion_politica <dbl> 9, 5, 2, 5, 6, 9, 7, 8, 8, 5, 3, 6, 7, 7, 0, 10,…
#Revisem si hi ha dades perdudes que puguin introduir biaixos (valors NA)
colSums(is.na(dades))
                   id                  edad                genero 
                    0                     0                     0 
            educacion        estado_laboral              ingresos 
                    0                     0                     0 
            ideologia                 grupo preocupacion_politica 
                    0                     0                     0 
#Descripció univariada de la variable dependent: analitzem la distribució de la preocupació per la política mitjançant estadístics descriptius bàsics.
summary(dades$preocupacion_politica)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  0.000   2.000   5.000   4.805   7.000  10.000 
#Comprovem l’assignació als grups experimental i de control
#Verifiquem el nombre d’individus assignats a cada grup per assegurar que l’assignació és aproximadament equilibrada.
table(dades$grupo)

  0   1 
497 503 
prop.table(table(dades$grupo))

    0     1 
0.497 0.503 

Respon les preguntes següents:

a. Descriu la preocupació per la política. Utilitza algun gràfic que consideris adequat per recolzar visualment la teva descripció.
Per descriure la preocupació per la política, he escollit un histograma, ja que es tracta d’una variable numèrica contínua mesurada en una escala de 0 a 10.
Aquest tipus de gràfic és adequat per analitzar la distribució de la variable, observar la dispersió dels valors i identificar possibles concentracions o asimetries, tal com es recomana al mòdul per a l’anàlisi descriptiva univariada.

El gràfic mostra que la preocupació per la política es distribueix de manera força homogènia entre els nivells baixos i mitjans, amb freqüències similars per a molts dels valors compresos entre 0 i 5.
Als nivells mitjans-alts, especialment al voltant dels valors 6 i 7, s’observa un lleuger increment de la freqüència, fet que indica que una part rellevant de la població presenta una preocupació política moderadament alta. En canvi, els nivells més extrems, com el valor 10, són menys freqüents, cosa que suggereix que la preocupació molt elevada existeix però no és majoritària. En conjunt, el gràfic evidencia una variabilitat considerable en la variable, sense concentracions extremes.

b. Examina ara la diferència entre la preocupació mitjana dels individus assignats als grups de control i tractament. Utilitza algun gràfic per recolzar la teva descripció. Quines diferències observes? (Una vegada més, hi pot haver diferents tipus de gràfics útils; utilitza aquell que creguis més adequat).
Per analitzar la diferència entre la preocupació mitjana dels individus assignats als grups de control i tractament, s’ha utilitzat un gràfic que combina la representació dels valors individuals amb la mitjana i el seu interval de confiança. Aquest tipus de visualització és adequat per comparar una variable numèrica entre dos grups i permet observar tant la variabilitat interna com les possibles diferències entre grups, d’acord amb la lògica experimental descrita al mòdul.

En aquest gràfic es compara la preocupació per la política entre els individus assignats al grup de control (grup 0) i al grup de tractament (grup 1). La variable representada a l’eix vertical és el nivell de preocupació per la política, mesurat en una escala de 0 a 10, mentre que l’eix horitzontal distingeix entre els dos grups de l’experiment.

Els punts grisos representen el valor individual de cada persona, cosa que permet observar la variabilitat interna dins de cada grup. El punt negre indica la preocupació mitjana de cada grup, i les barres corresponen a l’interval de confiança al voltant d’aquesta mitjana.

Pel que fa a les diferències observades, el grup de control, que no ha estat exposat a la notícia sobre corrupció, presenta una preocupació mitjana per la política més baixa.
En canvi, el grup de tractament, exposat a la notícia, mostra una preocupació mitjana més elevada. Tot i que en ambdós grups hi ha una dispersió considerable de valors individuals, la diferència entre les mitjanes és visible i consistent.
Així, el gràfic suggereix que l’exposició a la notícia sobre corrupció s’associa amb un augment del nivell mitjà de preocupació per la política.

c.En teoria, si l’assignació al grup de tractament i control ha funcionat correctament, les característiques dels individus haurien de ser, en mitjana, molt semblants a cada grup. Veient el gràfic dels ingresos. Observes alguna diferència?

No s’observen diferències significatives en els ingressos entre el grup de control i el grup de tractament, cosa que indica que l’assignació aleatòria ha funcionat correctament per a aquesta variable.

Finalment, repetim l’operació per al cas de la ideologia: són diferents els grups de control (0) i tractament (1) en termes d’ideologia? Ho veiem amb un gràfic.

Repetint l’anàlisi per a la variable ideologia, mesurada en una escala de 0 (extrema esquerra) a 10 (extrema dreta), observem el mateix patró: les mitjanes dels dos grups són gairebé iguals, els intervals de confiança se solapen i la distribució dels valors és molt semblant.
Això indica que no hi ha diferències ideològiques prèvies entre els grups i permet afirmar que l’assignació aleatòria ha funcionat correctament i que les diferències observades posteriorment en la preocupació per la política poden atribuir-se al tractament i no a diferències inicials entre els individus.

BIBLIOGRAFIA

Europa Press Economía Finanzas. (2025). Vox culpa a la inmigración del estancamiento de los salarios y pide cesar la política de “fronteras abiertas”. Europa Press. Disponible a:
Europa Press – Vox culpa a la inmigración del estancamiento de los salarios

Mas, J. [Jordi]. Vall, P. [Pau]. (2023). Anàlisi Bivariada. Fundació UOC. Disponible a:
https://jmas.quarto.pub/analisi-bivariada-cat/