| Any | n |
|---|---|
| 2013 | 7174 |
| 2018 | 8668 |
| 2023 | 8345 |
Ús del català i origen migratori a Catalunya (2013-2023)
Anàlisi de l’EULP i del Baròmetre d’Opinió Política (CEO)
1. Introducció
Els fluxos migratoris han transformat profundament la composició demogràfica de Catalunya en les darreres dècades. Segons l’EULP, la població nascuda a l’estranger ha passat del 9,3% (2003) al 22,5% (2023). Aquesta diversificació de la població planteja preguntes sobre l’ús i l’adopció del català entre els diferents col·lectius.
Aquest informe analitza l’evolució de l’ús del català com a llengua habitual entre 2013 i 2023, posant el focus en les diferències per origen geogràfic dels parlants.
Pregunta de recerca: L’evolució de l’ús del català com a llengua habitual difereix segons l’origen dels parlants? En particular, els migrants africans mostren un patró diferent del dels migrants llatinoamericans o europeus?
2. Dades i metodologia
2.1 Fonts de dades
S’utilitzen les microdades de l’Enquesta d’Usos Lingüístics de la Població (EULP) per als anys 2013, 2018 i 2023. L’EULP és una estadística oficial quinquennal elaborada per l’Idescat i el Departament de Política Lingüística, amb una mostra representativa de la població de 15 anys o més de Catalunya.
2.2 Variables
Variable dependent: Llengua habitual (4 categories: Català, Castellà, Ambdues, Altres).
Variable independent principal: Grup d’origen, construït a partir del lloc de naixement (P131/P65) i la llengua inicial (P6/P8) com a proxy. Per als nascuts a l’estranger, la llengua inicial permet distingir entre: - Amèrica Llatina (llengua inicial castellà) - Europa (inicial llengües europees no ibèriques) - Àfrica (inicial àrab o berber) - Àsia (inicial xinès)
Controls: Sexe, edat, nivell d’estudis.
Noves variables per a l’anàlisi intergeneracional: - Generació (gen_immigrant): Autòcton (nascut a Catalunya amb pares nascuts a Catalunya), 2a generació (nascut a Catalunya amb almenys un pare nascut a l’estranger), Resta Espanya, 1a generació (nascut a l’estranger). - Anys a Catalunya (anys_cat): anys de residència a Catalunya, calculat com any_enquesta - any_arribada per als nascuts fora, i com l’edat per als nascuts a Catalunya.
2.3 Model estadístic
Regressió logística multinomial (nnet::multinom) amb la llengua habitual com a dependent (categoria de referència: Castellà) i predictors:
\[P(Y = j) = \frac{e^{X\beta_j}}{\sum_{k=1}^{4} e^{X\beta_k}}\]
El model inclou la interacció grup_origen × any per captar si les tendències temporals difereixen per origen.
3. Anàlisi descriptiva
3.1 Evolució del català com a llengua habitual
La figura mostra l’evolució del percentatge de població que té el català com a llengua habitual, per grup d’origen. S’observa una tendència general a la baixa, però amb diferències notables entre grups.
3.2 Transició de llengua inicial a habitual
La figura mostra, per a cada llengua inicial, com es distribueix la llengua habitual a cada onada. Les persones amb llengua inicial catalana mantenen majoritàriament el català com a habitual, mentre que les que tenen el castellà com a llengua inicial presenten una distribució més diversa.
3.3 Distribució per edat i origen
La distribució per edat revela perfils demogràfics diferents: la població immigrada es concentra a les edats laborals (25-44 anys), mentre que la població nascuda a Catalunya té una distribució més equilibrada.
3.4 Mapa de calor
El mapa de calor mostra la intensitat de cada categoria de llengua habitual per combinació d’origen i any.
4. Modelització
4.1 Resultats del model multinomial
### Test de la interacció any×origen
Model Resid. df Resid. Dev
1 grup_origen_simple + any + sexe + edat_ampli + estudis 72513 30399896372
2 grup_origen_simple * any + sexe + edat_ampli + estudis 72483 30343839650
Test Df LR stat. Pr(Chi)
1 NA NA NA
2 1 vs 2 30 56056722 0
### Probabilitats predites (efectes marginals mitjans)
| grup_origen_simple | llengua | 2013 | 2018 | 2023 |
|---|---|---|---|---|
| Catalunya | Català | 0.580 | 0.560 | 0.517 |
| Resta Espanya | Català | 0.086 | 0.099 | 0.100 |
| Europa | Català | 0.058 | 0.051 | 0.060 |
| Amèrica Llatina | Català | 0.032 | 0.027 | 0.015 |
| Àfrica | Català | 0.036 | 0.043 | 0.046 |
| Altres | Català | 0.037 | 0.041 | 0.041 |
4.2 Prediccions completes
4.3 Interpretació dels resultats
La interacció grup_origen × any és estadísticament significativa (\(\chi^2 = 5.6 \times 10^7\), \(p < 0.001\)), cosa que indica que l’evolució temporal de l’ús del català difereix significativament segons l’origen.
Els resultats principals són:
Població nascuda a Catalunya: l’ús del català com a llengua habitual baixa del 58% (2013) al 52% (2023), mentre creix l’ús bilingüe (català i castellà) del 9% al 12%.
Població nascuda a la resta d’Espanya: el castellà es mant com a llengua dominant (74% el 2023), amb un lleu increment del català i del bilingüisme.
Migrants europeus: predomina l’ús d’altres llengües (70-71%), amb un ús del català baix però creixent (0,9% → 1,6%).
Migrants llatinoamericans: el castellà és la llengua habitual dominant (79% el 2023), amb un ús del català molt baix (0,5% o inferior) i estable.
Migrants africans: presenten el perfil més singular: només el 19% té el castellà com a llengua habitual (el valor més baix entre tots els grups), mentre que el 77% usa altres llengües. L’ús del català, tot i ser baix (2,5% el 2023), mostra una tendència creixent (1,2% → 1,9% → 2,5%), cosa que suggereix una progressiva incorporació lingüística.
4.4 Transmissió intergeneracional
Un segon model substitueix el grup d’origen per la variable gen_immigrant per avaluar si la 2a generació (fills d’immigrants nascuts a Catalunya) s’assembla més als autòctons o als immigrants de 1a generació en els seus usos lingüístics.
### Probabilitats predites per generació
| gen_immigrant | any | Català | Castellà | Ambdues | Altres |
|---|---|---|---|---|---|
| Autòcton | 2013 | 0.584 | 0.328 | 0.085 | 0.003 |
| Autòcton | 2018 | 0.568 | 0.338 | 0.088 | 0.005 |
| Autòcton | 2023 | 0.528 | 0.330 | 0.129 | 0.013 |
| Resta Espanya | 2013 | 0.086 | 0.855 | 0.054 | 0.005 |
| Resta Espanya | 2018 | 0.099 | 0.817 | 0.069 | 0.015 |
| Resta Espanya | 2023 | 0.100 | 0.792 | 0.078 | 0.030 |
| 1a generació | 2013 | 0.057 | 0.628 | 0.024 | 0.292 |
| 1a generació | 2018 | 0.046 | 0.598 | 0.030 | 0.327 |
| 1a generació | 2023 | 0.040 | 0.591 | 0.028 | 0.341 |
| 2a generació | 2013 | 0.466 | 0.372 | 0.099 | 0.062 |
| 2a generació | 2018 | 0.342 | 0.386 | 0.173 | 0.099 |
| 2a generació | 2023 | 0.232 | 0.483 | 0.104 | 0.181 |
Resultats: - La 2a generació partia d’una posició relativament propera als autòctons el 2013 (46,6% de català habitual, vs 58,4% dels autòctons), però el 2023 ha caigut fins al 23,2%, allunyant-se significativament del perfil autòcton. - La 1a generació manté valors molt baixos i estables de català (3-6%), amb predomini d’altres llengües (29-34%). - La població autòctona es manté estable (52-58% de català). - La població de la resta d’Espanya mostra un lleu increment del català (8,6% → 10,0%).
Aquest patró suggereix que la transmissió intergeneracional del català s’està debilitant: la 2a generació adopta el català en menor mesura que els autòctons i aquesta distància s’eixampla amb el temps.
4.5 Anys de residència i adopció del català
Una pregunta clau per entendre la integració lingüística és si l’adopció del català augmenta amb el temps de residència a Catalunya. La figura següent mostra el percentatge de població immigrada que té el català com a llengua habitual en funció dels anys que fa que viu a Catalunya, desglossat per origen i onada de l’enquesta.
Les dades mostren patrons marcadament diferents segons l’origen:
Resta d’Espanya: és el grup amb més adopció del català a curt termini (17% als 5-9 anys el 2023), però la tendència no és clarament creixent amb els anys: el percentatge es mou entre el 6% i el 17% sense un gradient temporal clar.
Europa: presenta un patró d’adopció progressiva: del 3% (5-9 anys) al 16% (30+ anys) el 2023, suggerint que la integració lingüística és un procés gradual.
Amèrica Llatina: mostra l’adopció més baixa de tots els grups, amb valors entre l’1% i el 5%, i amb un lleu increment només a llarg termini (30+ anys). Això confirma que el fet de compartir el castellà com a llengua primera redueix els incentius per adoptar el català.
Àfrica: els migrants africans mostren una adopció creixent amb els anys de residència (del 0% als primers anys al 6-7% a partir dels 20 anys), tot i que amb oscil·lacions entre onades.
L’evolució temporal (comparant 2013, 2018 i 2023) és heterogènia: mentre que els europeus i llatinoamericans mostren certa estabilitat o lleu millora, els africans presenten un increment notable de l’adopció entre 2013 i 2023 en les cohorts de llarga durada (20+ anys). Aquest resultat és coherent amb l’anàlisi del model multinomial (secció 4.1), que ja identificava els migrants africans com el grup amb una tendència més positiva.
Per confirmar la significació estadística d’aquests patrons, s’estima un model de regressió logística amb la probabilitat de tenir el català com a llengua habitual com a variable dependent, incloent els anys de residència agrupats, l’origen, l’any, el sexe i el nivell d’estudis com a predictors, amb els pesos mostrals normalitzats.
Resultats del model logístic:
L’efecte conjunt dels anys de residència és altament significatiu (\(\chi^2 = 76\), \(p < 0.001\)). En comparació amb els immigrants que porten menys de 5 anys, la probabilitat de parlar català es multiplica per 5,4 (5-9 anys), 7,1 (10-19 anys), 10,4 (20-29 anys) i 17,0 (30+ anys), totes les diferències estadísticament significatives.
Origen: els immigrants llatinoamericans tenen una probabilitat significativament menor de parlar català que els de la resta d’Espanya (\(p < 0.001\)), mentre que europeus i africans no difereixen significativament del grup de referència un cop controlat el temps de residència.
Efecte temporal: no s’observa un efecte significatiu de l’any de l’enquesta, cosa que indica que, un cop controlat el temps de residència, la probabilitat de parlar català entre els immigrants es manté estable entre 2013 i 2023.
Aquests resultats confirmen que el temps de residència a Catalunya és un factor clau per a l’adopció del català, però el seu efecte varia substancialment segons l’origen: mentre que per a europeus i africans l’adopció és un procés gradual, per als llatinoamericans la barrera lingüística (compartir el castellà) fa que l’increment amb els anys sigui molt més modest.
5. Anàlisi complementària: Baròmetre d’Opinió Política (CEO)
Com a anàlisi complementària, s’utilitzen les dades del Baròmetre d’Opinió Política (BOP) del Centre d’Estudis d’Opinió (CEO), accessibles a través del paquet CEOdata (versió acumulada presencial 2014-2020). El BOP permet explorar una dimensió que l’EULP no capta directament: la identitat nacional com a possible moderadora de la relació entre origen i ús lingüístic.
5.1 Dades i variables
S’analitzen 8.451 enquestats amb dades completes de llengua habitual, origen, identitat nacional i controls sociodemogràfics, corresponents a les onades del BOP entre 2014 i 2020.
La identitat nacional es mesura amb l’escala de catalanisme (CAT 0-10) i espanyolisme (ESP 0-10), a partir de les quals es construeix una variable categòrica de 5 nivells: principalment català, més català que espanyol, igual ambdues, més espanyol que català, principalment espanyol.
5.2 Identitat i origen
La figura mostra una associació clara entre lloc de naixement i identitat: la majoria dels nascuts a Catalunya s’identifiquen com a “principalment catalans” (53%), mentre que els nascuts a la resta d’Espanya predominen les identitats espanyoles o equilibrades. Entre els estrangers, la categoria més freqüent és “igual ambdues” (41%), cosa que suggereix processos d’identificació dual.
5.3 Llengua habitual i identitat
La figura revela una gradació clara: com més catalana és la identitat, més alta és la probabilitat de tenir el català com a llengua habitual. Entre els “principalment catalans”, el català és la llengua habitual del 62%; entre els “principalment espanyols”, només del 14%.
5.4 Model multinomial: origen × identitat
S’estima un model multinomial amb la interacció origen × identitat, controls d’edat, sexe, estudis i any. La taula següent mostra les probabilitats predites de català com a llengua habitual per a l’any 2020:
| origen | Principalment espanyol | Més espanyol que català | Igual ambdues | Més català que espanyol | Principalment català |
|---|---|---|---|---|---|
| Catalunya | 11.7% | 16.7% | 26.2% | 56.3% | 75.1% |
| Resta Espanya | 4.0% | 4.8% | 7.0% | 25.5% | 46.3% |
| Estranger | 0.0% | 0.8% | 3.7% | 12.9% | 33.6% |
Resultats:
- La identitat nacional és un predictor potent de la llengua habitual: la diferència entre “principalment català” i “principalment espanyol” dins del mateix grup d’origen és de fins a 30 punts percentuals.
- Per als nascuts a Catalunya que s’identifiquen com a “principalment catalans”, la probabilitat de parlar català habitualment supera el 70% (2020).
- Per als estrangers que s’identifiquen com a “principalment catalans”, la probabilitat de parlar català (14%) és molt superior a la dels estrangers “principalment espanyols” (~0%).
- La interacció
origen × identitatsuggereix que l’efecte de la identitat és més intens entre els immigrants que entre els autòctons: identificar-se com a català té un impacte més gran en l’adopció del català per als nascuts a l’estranger.
5.5 Model alternatiu: identitat contínua
El model amb la identitat com a variable contínua (ident_diff, de -10 a +10) confirma els resultats: cada punt d’increment en la identificació catalana (vs espanyola) s’associa amb un augment significatiu de la probabilitat de parlar català (OR = 1.44, p < 0.001), amb un efecte lleugerament superior entre els immigrants.
Aquests resultats complementen l’anàlisi de l’EULP suggerint que la identitat nacional és un mecanisme clau que connecta l’origen amb l’ús lingüístic: no és només d’on es ve, sinó també com s’identifica, el que determina la llengua que es parla.
5.6 Llengua habitual i comportament electoral
L’anàlisi del BOP també permet explorar com es relaciona la llengua habitual amb el comportament electoral. La figura següent mostra la distribució del vot recordat al Parlament de Catalunya en funció de la llengua habitual dels enquestats (BOP 2014-2020).
La figura revela una polarització lingüística del vot molt marcada:
Catalans: el vot es concentra en partits independentistes: Junts (45%), ERC (28%) i CUP (11%). El vot a partits unionistes o federalistes és testimonial (PSC 5%, Comuns 6%, Cs 2%, PP 1%).
Castellanoparlants: el vot es distribueix entre PSC (29%), Cs (18%), Comuns (18%) i PP (8%). El vote independentista és molt minoritari (ERC 8%, Junts 9%, CUP 3%).
Bilingües (ambdues llengües): presenten un perfil intermedi, amb suport tant a partits independentistes (Junts 24%, ERC 17%, CUP 9%) com a federalistes/unionistes (PSC 16%, Comuns 17%, Cs 9%).
Aquest patró suggereix que la llengua habitual no és només un marcador identitari o cultural, sinó que també està fortament alineada amb les opcions polítiques, especialment en l’eix nacional. L’ús del català com a llengua habitual s’associa amb percentatges de vot independentista que superen el 80%, mentre que entre els castellanoparlants el vot a partits no independentistes supera el 70%.
6. Discussió
Els resultats confirmen que l’origen geogràfic és un factor clau per entendre els usos lingüístics a Catalunya, i que les tendències evolucionen de manera diferent per a cada col·lectiu.
La hipòtesi inicial —que els migrants africans mostren un ús del català més elevat que altres grups— es matisa: el nivell d’ús del català és baix en tots els grups immigrants, però la tendència a l’alça en el cas africà (contràriament a l’estabilitat dels llatinoamericans) suggereix dinàmiques d’integració diferencials que mereixen investigació futura.
Transmissió intergeneracional: L’anàlisi per generacions revela que la 2a generació —fills d’immigrants nascuts a Catalunya— ha experimentat una caiguda substancial de l’ús del català com a llengua habitual (del 46,6% el 2013 al 23,2% el 2023). Aquest resultat és especialment rellevant per al debat sobre la transmissió del català entre generacions i suggereix que la incorporació lingüística no es produeix de manera automàtica en la descendència dels immigrants.
Identitat nacional: L’anàlisi del BOP aporta una dimensió addicional: la identitat nacional modera significativament la relació entre origen i ús lingüístic. Independentment del lloc de naixement, les persones que s’identifiquen com a catalanes tenen una probabilitat més alta de parlar català. Aquest resultat suggereix que el mecanisme subjacent no és exclusivament demogràfic, sinó també identitari.
Limitacions: - La classificació d’origen mitjançant la llengua inicial és una proxy imperfecta - No s’ha pogut incorporar l’efecte contextual municipal per manca d’identificador geogràfic a les microdades - La 2a generació és un grup reduït (487 observacions), cosa que limita la precisió de les estimacions - El BOP només cobreix població amb ciutadania espanyola, cosa que exclou immigrants sense nacionalitat - Les dades de llengua habitual del BOP arriben fins al 2020; caldrà actualitzar l’anàlisi amb properes onades
7. Conclusions
- L’ús del català com a llengua habitual ha disminuït a Catalunya entre 2013 i 2023, passant del 36% al 33% en termes poblacionals.
- Les tendències varien significativament per origen: el descens es concentra en la població nascuda a Catalunya, mentre que els grups immigrants mostren patrons estables o lleument creixents.
- Els migrants africans presenten el perfil més diferenciat: baix ús del castellà i una lleu tendència a l’alça en l’adopció del català.
- Els migrants llatinoamericans mantenen el castellà com a llengua gairebé exclusiva, amb molt baixa adopció del català.
- La transmissió intergeneracional es debilita: la 2a generació mostra un descens marcat de l’ús del català (del 46,6% al 23,2%), una tendència que podria accentuar-se en el futur.
- La identitat nacional modera la relació: les dades del CEO mostren que, independentment de l’origen, identificar-se com a català incrementa significativament la probabilitat de parlar català. Aquest efecte és especialment rellevant entre els immigrants.
- L’adopció del català entre immigrants augmenta significativament amb els anys de residència (\(\chi^2 = 76\), \(p < 0.001\)): la probabilitat de parlar català es multiplica per 17 entre els que porten 30+ anys respecte als que porten menys de 5. No obstant, el ritme varia per origen: els europeus mostren una progressió gradual (del 3% al 16%), els llatinoamericans mantenen valors molt baixos fins i tot després de 30 anys (5%), i els africans presenten una tendència a l’alça coherent amb el model multinomial.
- La llengua habitual estructura el comportament electoral: les dades del BOP revelen una polarització lingüística del vot al Parlament de Catalunya. El 84% dels catalanoparlants vota partits independentistes, mentre que el 73% dels castellanoparlants vota partits unionistes o federalistes. Aquesta alineació entre llengua i vot suggereix que l’eix lingüístic i l’eix nacional estan profundament entrellaçats en la configuració política de Catalunya.
8. Referències
Idescat & Departament de Política Lingüística. Enquesta d’usos lingüístics de la població (EULP). 2013, 2018, 2023. Microdades disponibles a: https://www.idescat.cat/dades/micro/?id=eulp
Centre d’Estudis d’Opinió (CEO). Baròmetre d’Opinió Política (BOP). 2014-2020. Microdades accessibles via paquet R CEOdata (v. 1.4.0). https://ceo.gencat.cat/