La pregunta de recerca que guia aquest anàlisi és:
“Quina relació hi ha entre l’edat d’un personatge i el seu nivell de poder?”
Aquesta pregunta està directament connectada amb les variables principals del nostre conjunt de dades:
Edat: Variable quantitativa contínua que representa els anys del personatge (en rang de 6 a 3000 anys, incloent personatges immortals o amb edats sobrenaturals).
Poder_nivell: Variable quantitativa contínua que mesura el nivell de poder del personatge en una escala de 0 a 100, on valors més alts indiquen major capacitat de combat o habilitats.
La motivació d’aquesta pregunta es donada en comprendre si existeix una correlació entre l’experiència acumulada amb l’edat i el desenvolupament del poder dels personatges dins l’univers dels anime shonen. És raonable hipotetitzar que personatges més grans podrien tenir més temps per entrenar i desenvolupar les seves habilitats.
Per respondre aquesta pregunta, explorarem:
El conjunt de dades utilitzat en aquest anàlisi és de font pròpia, construït a partir d’informació extreta de pàgines web públiques especialitzades en anime i manga. Les fonts utilitzades per compilar aquestes dades inclouen:
Les dades van ser recopilades manualment durant novembre-desembre de 2024, verificant la informació entre múltiples fonts per assegurar-ne la consistència i fiabilitat.
El conjunt de dades conté informació sobre personatges de diferents anime shonen, incloent sèries reconegudes com Naruto, One Piece, Dragon Ball Z, My Hero Academia, Jujutsu Kaisen, Demon Slayer, entre d’altres. Cada observació representa un personatge individual amb les seves característiques associades.
Per a aquest estudi, ens centrarem en les següents variables:
Edat (Edat): Variable quantitativa
contínua que indica l’edat del personatge en anys. Aquesta variable
presenta un rang ampli que va des dels 6 fins als 3000 anys, degut a la
presència de personatges immortals o amb edats sobrenaturals.
Poder_nivell (Poder_nivell):
Variable quantitativa contínua que mesura el nivell de poder del
personatge en una escala de 0 a 100, on valors més elevats representen
una major capacitat de combat, força o habilitats especials.
El conjunt de dades també inclou altres variables que poden ser rellevants per a anàlisis complementàries:
Nombre d’observacions: El conjunt de dades conté 105 personatges registrats.
Context temporal: Els personatges provenen d’anime produïts entre finals dels anys 90 i l’actualitat, representant diferents generacions del gènere shonen.
Població estudiada: Personatges ficticis d’anime shonen japonès, amb una representació diversa de diferents sèries, edats i tipus de poder.
Per facilitar l’anàlisi i la interpretació dels resultats, s’ha creat una variable derivada:
Grup_Edat): Variable
categòrica creada mitjançant la partició de la variable
Edat en quatre grups:
Aquesta categorització permet analitzar diferències en el nivell de poder entre diferents etapes de desenvolupament dels personatges i facilita la comparació entre grups.
| Grup d’Edat | Nombre de Personatges |
|---|---|
| 0-15 anys | 20 |
| 16-18 anys | 39 |
| 19-28 anys | 27 |
| 29+ anys | 19 |
Abans d’aprofundir en l’anàlisi estadística, cal explorar les característiques bàsiques de les variables d’interès per comprendre la seva distribució i identificar possibles patrons o anomalies.
| Variable | Mitjana | Mediana | Desviació_Estàndard | Mínim | Màxim | Q1 | Q3 |
|---|---|---|---|---|---|---|---|
| Edat | 137.94 | 18 | 522.50 | 6 | 3000 | 16 | 27 |
| Poder_nivell | 82.71 | 84 | 11.47 | 35 | 100 | 78 | 90 |
Interpretació de l’Edat:
La variable Edat presenta una distribució fortament asimètrica. La mitjana (137.94 anys) és molt superior a la mediana (18 anys), indicant que la majoria de personatges són joves però un petit nombre amb edats extremes (fins a 3000 anys) eleva considerablement la mitjana. El 75% dels personatges tenen 27 anys o menys (Q3 = 27), confirmant la concentració en edats joves. La desviació estàndard molt elevada (522.50) reflecteix aquesta alta dispersió provocada per personatges immortals o mil·lenaris.
Interpretació del Poder:
El Nivell de Poder mostra una distribució més simètrica, amb mitjana (82.71) i mediana (84) molt properes. La desviació estàndard moderada (11.47) indica que els nivells de poder són més homogenis entre personatges. El rang interquartílic (Q1=76, Q3=90) mostra que el 50% central dels personatges tenen poder entre 76 i 90 punts.
Observacions del gràfic de dispersió:
| Grup_Edat | N_Personatges | Poder_Mitjà | Poder_Mediana | Desviació_Estàndard | Poder_Mínim | Poder_Màxim |
|---|---|---|---|---|---|---|
| 0-15 anys | 20 | 77.25 | 81 | 12.57 | 50 | 92 |
| 16-18 anys | 39 | 79.72 | 79 | 10.86 | 35 | 98 |
| 19-28 anys | 27 | 86.04 | 89 | 10.99 | 45 | 100 |
| 29+ anys | 19 | 89.89 | 90 | 6.79 | 75 | 99 |
Per explorar visualment la relació entre l’edat dels personatges i el seu nivell de poder, hem creat un gràfic de caixa (boxplot) agrupat per rangs d’edat:
Interpretació dels elements del gràfic:
De l’exploració inicial de les dades, s’observen diversos patrons rellevants:
Tot i que el grup de 16-18 anys és el més nombrós amb 39 personatges, el poder mitjà augmenta progressivament amb l’edat. Aquesta tendència és especialment pronunciada en personatges de més de 29 anys, que solen tenir rols més poderosos, llegendaris o de mentors dins les seves respectives sèries.
Concretament:
La dispersió del nivell de poder varia considerablement entre grups. Els personatges més joves (0-18 anys) mostren una variabilitat moderada, mentre que el grup de 29+ anys presenta tant personatges extremadament poderosos com alguns amb nivells més modestos, reflectint la diversitat de rols narratius (des de mentors veterans fins a personatges mil·lenaris).
S’identifiquen diversos valors atípics (marcats en vermell al gràfic):
Aquests outliers suggereixen que, tot i la tendència general, hi ha factors més enllà de l’edat que determinen el poder dels personatges, com el rol narratiu, el tipus de poder o el talent innat.
Aquesta exploració inicial proporciona evidència preliminar que sí existeix una relació positiva entre l’edat i el nivell de poder dels personatges de shonen. No obstant això, la relació no és perfectament lineal ni determinista:
Aquestes observacions inicials motiven un anàlisi estadístic més rigorós per quantificar la força de la relació entre edat i poder, i per explorar si aquesta relació és estadísticament significativa o podria ser fruit de l’atzar.
Per comprendre millor la relació entre l’edat i el nivell de poder, comencem analitzant les mesures de tendència central i dispersió de les variables principals.
| Variable | Mitjana | Mediana | Desv. Estàndard | Coef. Variació |
|---|---|---|---|---|
| Edat (anys) | 137.94 | 18 | 522.50 | 378.7% |
| Nivell de Poder | 82.71 | 84 | 11.47 | 13.9% |
Variable Edat:
La variable edat presenta una mitjana de 137.94 anys i una mediana de 18 anys, valors notablement diferents que indiquen una distribució fortament asimètrica cap a la dreta (positiva). Aquesta gran diferència entre mitjana i mediana es deu a la presència de personatges amb edats extremadament elevades (fins a 3000 anys), com ara éssers immortals o mil·lenaris presents en sèries com Seven Deadly Sins o Jujutsu Kaisen.
La desviació estàndard de 522.50 anys confirma l’alta dispersió de les dades. El coeficient de variació del 378.7% (calculat com SD/Mitjana × 100) indica una variabilitat extremadament alta, superior al 100%, la qual cosa és habitual quan hi ha valors outliers molt extrems. Això suggereix que la majoria de personatges són joves (adolescents o joves adults), però un petit nombre de personatges amb edats sobrenaturals eleva considerablement la mitjana.
Variable Nivell de Poder:
El nivell de poder presenta una mitjana de 82.71 i una mediana de 84, valors molt propers que suggereixen una distribució relativament simètrica. La desviació estàndard de 11.47 indica una dispersió moderada al voltant de la mitjana, amb un coeficient de variació del 13.9%, molt inferior al de l’edat, la qual cosa indica que els nivells de poder estan més concentrats i són més homogenis entre personatges.
## Correlació de Pearson entre Edat i Nivell de Poder: 0.165
La correlació de Pearson entre l’edat i el nivell de poder és de r = 0.165, la qual cosa indica una correlació positiva feble. Aquest valor suggereix que hi ha una tendència lleu que personatges més grans tinguin nivells de poder lleugerament superiors, però la relació no és forta ni determinista.
Interpretació: Una correlació de 0.165 està molt propera a 0 (absència de relació lineal), indicant que l’edat per si sola explica només una petita part de la variabilitat en el nivell de poder. Això suggereix que altres factors (com el tipus de poder, el rol narratiu, el talent innat, o l’anime d’origen) poden tenir més influència en determinar el poder d’un personatge que la seva edat cronològica.
Per explorar amb més detall com varia el nivell de poder segons l’edat, hem dividit els personatges en quatre grups etaris i analitzat les seves estadístiques descriptives.
| Grup d’Edat | N | Mitjana | Mediana | Desv. Estàndard |
|---|---|---|---|---|
| 0-15 anys | 20 | 77.2 | 81 | 12.6 |
| 16-18 anys | 39 | 79.7 | 79 | 10.9 |
| 19-28 anys | 27 | 86.0 | 89 | 11.0 |
| 29+ anys | 19 | 89.9 | 90 | 6.8 |
Tendència creixent amb l’edat: Es confirma que el poder mitjà augmenta progressivament amb l’edat dels grups:
Aquesta tendència representa un increment de 12.7 punts entre el grup més jove i el més gran, equivalent a un augment del 16.5%.
El grup de 16-18 anys és el més nombrós: Amb 39 personatges (37% del total), aquest grup reflecteix la tendència dels anime shonen a centrar-se en protagonistes adolescents.
Menor variabilitat en edats avançades: El grup de 29+ anys presenta la desviació estàndard més baixa (6.8), indicant que els personatges més grans tendeixen a tenir nivells de poder més homogenis i consistentment elevats. Això podria reflectir que els personatges adults solen tenir rols de mentors, antagonistes poderosos o llegendaris.
Major dispersió en grups joves: Els grups de 0-15 i 16-18 anys mostren desviacions estàndard més altes (12.6 i 10.9 respectivament), suggerint major heterogeneïtat en els nivells de poder dels personatges joves, que poden incloure tant protagonistes excepcionalment talentosos com personatges de suport amb habilitats modestes.
El violinplot combina elements d’un boxplot amb una estimació de densitat de probabilitat (les “ales” del violí), permetent visualitzar simultàniament la forma de la distribució i les mesures de tendència central.
Interpretació del gràfic:
El gràfic de densitat superposada permet comparar les distribucions dels diferents grups d’edat en un sol gràfic. Observem que:
Com a variable addicional, hem explorat si el sexe dels personatges influeix en el seu nivell de poder.
| Sexe | N | Mitjana de Poder | Desv. Estàndard |
|---|---|---|---|
| Femení | 34 | 77.4 | 12.1 |
| Masculí | 71 | 85.2 | 10.3 |
Observacions:
Interpretació contextual: Aquesta diferència podria reflectir patrons narratius comuns en el gènere shonen, que històricament ha tendit a centrar-se en protagonistes masculins i a assignar rols de combat principals a personatges masculins. No obstant això, també trobem personatges femenins amb nivells de poder excepcionals (outliers en el gràfic), indicant que aquesta tendència no és absoluta.
Basant-nos en l’anàlisi descriptiva, formulem les següents hipòtesis per verificar estadísticament les relacions observades:
H₀ (Hipòtesi nul·la): No hi ha correlació lineal entre l’edat i el nivell de poder dels personatges (ρ = 0)
H₁ (Hipòtesi alternativa): Hi ha una correlació lineal significativa entre l’edat i el nivell de poder (ρ ≠ 0)
Mètode: Test de correlació de Pearson
H₀ (Hipòtesi nul·la): Les mitjanes de poder són iguals entre tots els grups d’edat (μ₁ = μ₂ = μ₃ = μ₄)
H₁ (Hipòtesi alternativa): Almenys una mitjana de poder és diferent entre els grups d’edat
Mètode: Anàlisi de Variància (ANOVA d’un factor)
H₀ (Hipòtesi nul·la): No hi ha associació entre el grup d’edat i la categoria de poder
H₁ (Hipòtesi alternativa): Hi ha associació entre el grup d’edat i la categoria de poder
Mètode: Test de Chi-quadrat (χ²) d’independència
H₀ (Hipòtesi nul·la): Les mitjanes de poder són iguals entre personatges masculins i femenins (μ_masculí = μ_femení)
H₁ (Hipòtesi alternativa): Les mitjanes de poder són diferents entre sexes (μ_masculí ≠ μ_femení)
Mètode: Test t de Student per a mostres independents
Utilitzem aquest test per quantificar la força i direcció de la relació lineal entre dues variables quantitatives contínues (Edat i Poder_nivell). La correlació de Pearson és adequada quan:
Nivell de significació: α = 0.05
L’ANOVA ens permet comparar les mitjanes de més de dos grups simultàniament, determinant si almenys una mitjana és significativament diferent. És el mètode adequat per:
Assumpcions de l’ANOVA:
Nivell de significació: α = 0.05
Aquest test avalua si hi ha una associació significativa entre dues variables categòriques. Per aplicar-lo:
Nivell de significació: α = 0.05
Utilitzem aquest test per comparar les mitjanes de poder entre dos grups (Masculí vs Femení).
Nivell de significació: α = 0.05
Abans de realitzar l’ANOVA, cal verificar que es compleixen les assumpcions necessàries.
## Test de Normalitat de Shapiro-Wilk per cada grup d'edat
## H₀: Les dades segueixen una distribució normal
## H₁: Les dades NO segueixen una distribució normal
## 0-15 anys: W = 0.8470, p-valor = 0.0047 (No normal ✗)
## 16-18 anys: W = 0.8748, p-valor = 0.0005 (No normal ✗)
## 19-28 anys: W = 0.7809, p-valor = 0.0001 (No normal ✗)
## 29+ anys: W = 0.9536, p-valor = 0.4545 (Normal ✓)
| Grup | W | p_valor | |
|---|---|---|---|
| W | 0-15 anys | 0.8470 | 0.0047 |
| W1 | 16-18 anys | 0.8748 | 0.0005 |
| W2 | 19-28 anys | 0.7809 | 0.0001 |
| W3 | 29+ anys | 0.9536 | 0.4545 |
Interpretació: Tres dels quatre grups (0-15, 16-18, 19-28 anys) NO segueixen una distribució normal (p-valor < 0.05). Només el grup de 29+ anys presenta normalitat. Això podria ser problemàtic per l’ANOVA, però el test és robust a violacions moderades de normalitat, especialment amb mides de mostra raonables (n > 20 per grup en la majoria de casos).
Interpretació dels Q-Q plots: Els punts haurien de seguir aproximadament la línia diagonal vermella si les dades fossin normals. Observem desviacions de la normalitat en alguns grups, especialment als extrems de la distribució.
## Test d'Homogeneïtat de Variàncies de Levene
## H₀: Les variàncies són iguals entre grups
## H₁: Les variàncies NO són iguals entre grups
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 0.6185 0.6046
## 101
Interpretació: El p-valor = 0.6046 > 0.05, per tant NO rebutgem H₀. Les variàncies són homogènies entre grups, complint aquesta assumpció de l’ANOVA.
Tot i que la normalitat no es compleix completament en tots els grups:
Per tant, procedim amb l’ANOVA però interpretarem els resultats amb cautela.
## ========== TEST DE CORRELACIÓ DE PEARSON ==========
## H₀: ρ = 0 (No hi ha correlació lineal)
## H₁: ρ ≠ 0 (Hi ha correlació lineal)
##
## Pearson's product-moment correlation
##
## data: dades$Edat and dades$Poder_nivell
## t = 1.6929, df = 103, p-value = 0.09349
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.0280132 0.3453111
## sample estimates:
## cor
## 0.1645355
Estadístic de prova: t = 1.6929
Graus de llibertat: df = 103
p-valor: 0.09349
Correlació observada: r = 0.1645
Interval de confiança 95%: [-0.028, 0.345]
Decisió estadística: Com que el p-valor (0.0935) > α (0.05), NO rebutgem H₀. No hi ha evidència estadística suficient per afirmar que existeix una correlació lineal significativa entre l’edat i el nivell de poder al nivell de significació del 5%.
Significat pràctic: Tot i que la correlació observada (r = 0.165) indica una lleu tendència positiva, aquesta relació podria ser deguda a l’atzar. L’interval de confiança inclou el 0, confirmant que no podem descartar que la correlació real sigui zero. Aquest resultat suggereix que l’edat per si sola NO és un bon predictor del nivell de poder.
## ========== ANÀLISI DE VARIÀNCIA (ANOVA) ==========
## H₀: μ₁ = μ₂ = μ₃ = μ₄ (totes les mitjanes són iguals)
## H₁: Almenys una mitjana és diferent
## Df Sum Sq Mean Sq F value Pr(>F)
## Grup_Edat 3 2225 741.7 6.542 0.000435 ***
## Residuals 101 11450 113.4
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Estadístic F: F = 6.5421
p-valor: p = 0.0004352182
Decisió estadística: Com que el p-valor (0.000435) < α (0.05), REBUTGEM H₀. Hi ha evidència estadística altament significativa (p < 0.001) que almenys una mitjana de poder és diferent entre els grups d’edat.
Significat pràctic: Els diferents grups d’edat presenten nivells de poder mitjans significativament diferents. Això confirma que l’edat (quan es categoritza en grups) SÍ té un efecte significatiu sobre el poder dels personatges.
| Grup d’Edat | N | Mitjana | SD | SE | IC 95% Inf | IC 95% Sup |
|---|---|---|---|---|---|---|
| 0-15 anys | 20 | 77.25 | 12.57 | 2.81 | 71.74 | 82.76 |
| 16-18 anys | 39 | 79.72 | 10.86 | 1.74 | 76.31 | 83.13 |
| 19-28 anys | 27 | 86.04 | 10.99 | 2.11 | 81.89 | 90.18 |
| 29+ anys | 19 | 89.89 | 6.79 | 1.56 | 86.84 | 92.95 |
Com que l’ANOVA és significativa, realitzem comparacions per parelles per identificar quins grups difereixen específicament.
## ========== TEST POST-HOC DE TUKEY (HSD) ==========
## Comparacions per parelles entre grups d'edat
## Si p adj < 0.05, la diferència és significativa
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Poder_nivell ~ Grup_Edat, data = dades)
##
## $Grup_Edat
## diff lwr upr p adj
## 16-18 anys-0-15 anys 2.467949 -5.1819412 10.11784 0.8338975
## 19-28 anys-0-15 anys 8.787037 0.5810933 16.99298 0.0308958
## 29+ anys-0-15 anys 12.644737 3.7339308 21.55554 0.0019184
## 19-28 anys-16-18 anys 6.319088 -0.6445189 13.28270 0.0894248
## 29+ anys-16-18 anys 10.176788 2.3949646 17.95861 0.0049966
## 29+ anys-19-28 anys 3.857700 -4.4713741 12.18677 0.6220218
##
## --- Comparacions Significatives (p adj < 0.05) ---
| Comparació | Diferència de Mitjanes | p-valor Ajustat |
|---|---|---|
| 19-28 anys-0-15 anys | 8.7870 | 0.0309 |
| 29+ anys-0-15 anys | 12.6447 | 0.0019 |
| 29+ anys-16-18 anys | 10.1768 | 0.0050 |
Resultats clau del test de Tukey:
Comparacions NO significatives:
Conclusió: Les diferències més marcades són entre el grup més jove (0-15 anys) i els grups adults (19-28 i 29+ anys), així com entre adolescents (16-18) i adults majors (29+). No hi ha diferències significatives entre grups adjacents d’edat.
Per complementar l’ANOVA, utilitzem el test de Chi-quadrat per avaluar l’associació entre grups d’edat i categories de poder.
## Creant categories de poder per tercils:
## Poder Baix: 35 - 80
## Poder Mitjà: 80 - 88
## Poder Alt: 88 - 100
##
## --- Taula de Contingència: Grup d'Edat vs Categoria de Poder ---
| Poder Baix | Poder Mitjà | Poder Alt | |
|---|---|---|---|
| 0-15 anys | 9 | 9 | 2 |
| 16-18 anys | 20 | 13 | 6 |
| 19-28 anys | 5 | 6 | 16 |
| 29+ anys | 2 | 7 | 10 |
##
## --- Percentatges per Files ---
| Poder Baix | Poder Mitjà | Poder Alt | |
|---|---|---|---|
| 0-15 anys | 45.0 | 45.0 | 10.0 |
| 16-18 anys | 51.3 | 33.3 | 15.4 |
| 19-28 anys | 18.5 | 22.2 | 59.3 |
| 29+ anys | 10.5 | 36.8 | 52.6 |
## ========== TEST DE CHI-QUADRAT (χ²) ==========
## H₀: No hi ha associació entre grup d'edat i categoria de poder
## H₁: Hi ha associació entre grup d'edat i categoria de poder
##
## Pearson's Chi-squared test
##
## data: taula_contingencia
## X-squared = 25.932, df = 6, p-value = 0.0002293
##
## --- V de Cramér ---
## V = 0.3514
## Interpretació: Associació MODERADA
Estadístic χ²: χ² = 25.93
Graus de llibertat: df = 6
p-valor: p = 0.0002292537
V de Cramér: V = 0.3514
Decisió estadística: Com que el p-valor (0.0002) < α (0.05), REBUTGEM H₀. Hi ha una associació estadísticament altament significativa entre el grup d’edat i la categoria de poder.
Significat pràctic: La V de Cramér de 0.35 indica una associació de intensitat moderada. Això significa que conèixer el grup d’edat d’un personatge proporciona informació útil per predir la seva categoria de poder, però no de manera determinista.
Observacions de la taula:
##
## --- Residus Estandarditzats de Pearson ---
## (Valors > |2| indiquen cel·les amb contribució important al χ²)
| Poder Baix | Poder Mitjà | Poder Alt | |
|---|---|---|---|
| 0-15 anys | 1.12 | 1.23 | -2.38 |
| 16-18 anys | 2.82 | 0.00 | -2.86 |
| 19-28 anys | -2.00 | -1.42 | 3.46 |
| 29+ anys | -2.41 | 0.36 | 2.08 |
Interpretació dels residus:
## ========== TEST T DE STUDENT ==========
## H₀: μ_masculí = μ_femení
## H₁: μ_masculí ≠ μ_femení
##
## Welch Two Sample t-test
##
## data: Poder_nivell by Sexe
## t = -3.2401, df = 56.856, p-value = 0.001998
## alternative hypothesis: true difference in means between group Femení and group Masculí is not equal to 0
## 95 percent confidence interval:
## -12.617977 -2.978543
## sample estimates:
## mean in group Femení mean in group Masculí
## 77.44118 85.23944
Estadístic t: t = -3.24
Graus de llibertat: df = 56.86
p-valor: p = 0.002
Diferència de mitjanes: -7.80 punts (Femení: 77.4, Masculí: 85.2)
Interval de confiança 95%: [-12.62, -2.98]
Decisió estadística: Com que el p-valor (0.002) < α (0.05), REBUTGEM H₀. Hi ha evidència estadística altament significativa que les mitjanes de poder són diferents entre sexes.
Significat pràctic: Els personatges masculins tenen, en mitjana, 7.8 punts més de poder que els femenins (aproximadament un 10% més). Aquesta diferència és estadísticament significativa i no pot ser atribuïda a l’atzar. Aquest resultat suggereix que el sexe és un factor rellevant per explicar el nivell de poder, possiblement reflectint patrons narratius del gènere shonen.
Després de realitzar múltiples anàlisis estadístiques, podem extreure les següents conclusions sobre la relació entre l’edat i el nivell de poder en personatges d’anime shonen:
Hem trobat un resultat