Uvažujeme lineárny regresný model, v ktorom vysvetľujeme trhovú cenu hráča (v mil. €) pomocou jeho veku a výšky.
Model má tvar:
\[\text{PRICE}_i = \beta_0 + \beta_1 \cdot \text{AGE}_i + \beta_2 \cdot \text{HEIGHT}_i + \varepsilon_i\]
Očakávame, že vek bude mať negatívny vplyv (\(\beta_1 < 0\)), keďže mladší hráči majú vyššiu trhovú hodnotu a dlhší zvyšný kariérny potenciál. Pri výške predpokladáme pozitívny vplyv (\(\beta_2 > 0\)), keďže vyšší hráči môžu byť na trhu hodnotení vyššie.
Tieto predpoklady budeme empiricky testovať pomocou štatistických hypotéz o jednotlivých regresných koeficientoch.
| Premenná | Odhad | Štand. chyba | t-hodnota | p-hodnota | |
|---|---|---|---|---|---|
| (Intercept) | Konštanta (β₀) | 43.3131 | 8.4702 | 5.1136 | 0.0000 |
| age | Vek (β₁) | -0.4276 | 0.0666 | -6.4165 | 0.0000 |
| height | Výška (β₂) | -11.6648 | 4.5739 | -2.5503 | 0.0108 |
Interpretácia koeficientov:
| Ukazovateľ | Hodnota |
|---|---|
| R² | 0.0188 |
| Upravený R² | 0.018 |
| Reziduálna štandardná chyba | 15.6499 |
| F-štatistika | 24.7734 |
| p-hodnota modelu | 2.202e-11 |
Interpretácia kvality modelu:
Model je ako celok štatisticky významný (F-test, p < 0.001), avšak hodnota R² = 0.0188 naznačuje, že vek a výška spoločne vysvetľujú len 1.88 % variability trhovej ceny hráčov. To naznačuje, že na cenu hráča majú podstatný vplyv aj iné faktory, ktoré model nezahŕňa — napríklad liga, herná pozícia či individuálna výkonnosť.
| Hráč | Skutočná cena (mil. €) | Vyrovnaná cena (mil. €) | Rezíduum (mil. €) | |
|---|---|---|---|---|
| 1 | Ederson | 45.00 | 8.98 | 36.02 |
| 2 | Stefan Ortega | 6.00 | 8.91 | -2.91 |
| 3 | Scott Carson | 0.25 | 5.56 | -5.31 |
| 4 | Rúben Dias | 75.00 | 10.38 | 64.62 |
| 5 | Nathan Aké | 35.00 | 10.34 | 24.66 |
| 6 | John Stones | 30.00 | 9.41 | 20.59 |
| 7 | Aymeric Laporte | 30.00 | 9.29 | 20.71 |
| 8 | Manuel Akanji | 30.00 | 9.84 | 20.16 |
| 9 | Sergio Gómez | 15.00 | 13.96 | 1.04 |
| 11 | Benjamin Mendy | NA | 8.28 | 6.72 |
Interpretácia: Rezíduá predstavujú rozdiel medzi skutočnou a modelom predikovanou cenou hráča. Veľké kladné rezíduum znamená, že hráč je na trhu oceňovaný výrazne vyššie, ako by predpovedal model — pravdepodobne vďaka faktorom, ktoré model nezohľadňuje (výkonnosť, popularita, pozícia).