Vyberieme DUSSELDORF ako príklad
analysis_data <- udaje %>%
mutate(
date = as.Date(DATE),
month = month(date)
) %>%
select(
date, month,
DUSSELDORF_cloud_cover,
DUSSELDORF_humidity,
DUSSELDORF_precipitation,
DUSSELDORF_sunshine,
DUSSELDORF_temp_max,
DUSSELDORF_temp_min,
DUSSELDORF_temp_mean,
DUSSELDORF_pressure,
DUSSELDORF_global_radiation,
) %>%
na.omit()Výška atmosférického tlaku má priamy vplyv na maximálnu dennú teplotu v Düsseldorfe
H₀: Atmosférický tlak nemá žiadny vplyv na maximálnu dennú teplotu v Düsseldorfe. (β₁ = 0)
H₁: Atmosférický tlak má štatisticky významný vplyv na maximálnu dennú teplotu v Düsseldorfe. (β₁ ≠ 0)
Call:
lm(formula = DUSSELDORF_temp_max ~ DUSSELDORF_pressure, data = analysis_data)
Residuals:
Min 1Q Median 3Q Max
-24.0444 -6.1106 0.0105 5.9218 23.2556
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 58.25 14.04 4.148 3.43e-05 ***
DUSSELDORF_pressure -42.26 13.82 -3.058 0.00225 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 7.77 on 3652 degrees of freedom
Multiple R-squared: 0.002554, Adjusted R-squared: 0.00228
F-statistic: 9.349 on 1 and 3652 DF, p-value: 0.002247
ggplot(analysis_data, aes(x = DUSSELDORF_pressure, y = DUSSELDORF_temp_max)) +
geom_point(alpha = 0.6, color = "steelblue") +
geom_smooth(method = "lm", color = "red", se = TRUE) +
labs(title = "Vplyv atmosférického tlaku na maximálnu teplotu v Düsseldorfe",
x = "Atmosférický tlak (hPa)",
y = "Maximálna denná teplota (°C)") +
theme_minimal()
# Reziduálna analýza
par(mfrow = c(2,2))ZÁVER: Na základe výsledkov lineárnej regresie zamietame nulovú hypotézu H0 a prijímame alternatívnu hypotézu H1. Atmosférický tlak má štatisticky významný vplyv na maximálnu dennú teplotu v Düsseldorfe.
Štatistické odôvodnenie:
p-hodnota pre tlak je 0.00225, čo je výrazne pod hranicou významnosti 0.05
t-hodnota -3.058 indikuje silnú evidencu proti nulovej hypotéze
koeficient -42.26 ukazuje, že so zvýšením tlaku o 1 hPa klesne teplota približne o 42.26°C
Interpretácia vzťahu:
Napriek štatistickej významnosti je praktický význam tohto vzťahu obmedzený, čo dokazuje veľmi nízky R-squared (0.00255). Model vysvetľuje len 0.25% variability teploty, čo znamená, že atmosférický tlak sám o sebe nie je dobrou predikčnou premennou pre teplotu. Záporný smer vzťahu je prekvapivý, pretože vysoký tlak zvyčajne prináša vyššie teploty. Tento neočakávaný výsledok by si vyžadoval ďalšiu analýzu iných meteorologických faktorov.
Globálne žiarenie má rastúci vplyv na denný teplotný rozsah (rozdiel medzi max a min teplotou) v Düsseldorfe
H₀: Globálne žiarenie nemá žiadny vplyv na denný teplotný rozsah v Düsseldorfe. (β₁ = 0)
H₁: S rastúcim globálnym žiarením sa zvyšuje denný teplotný rozsah v Düsseldorfe. (β₁ > 0)
# Vytvorenie novej premennej - denný teplotný rozsah
analysis_data <- udaje %>%
mutate(DUSSELDORF_temp_range = DUSSELDORF_temp_max - DUSSELDORF_temp_min)
model_range <- lm(DUSSELDORF_temp_range ~ DUSSELDORF_global_radiation, data = analysis_data)
summary(model_range)
Call:
lm(formula = DUSSELDORF_temp_range ~ DUSSELDORF_global_radiation,
data = analysis_data)
Residuals:
Min 1Q Median 3Q Max
-6.8215 -1.7406 -0.2678 1.5489 11.1019
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.48366 0.06414 69.90 <2e-16 ***
DUSSELDORF_global_radiation 3.45368 0.04435 77.88 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.361 on 3652 degrees of freedom
Multiple R-squared: 0.6242, Adjusted R-squared: 0.6241
F-statistic: 6065 on 1 and 3652 DF, p-value: < 2.2e-16
ggplot(analysis_data, aes(x = DUSSELDORF_global_radiation, y = DUSSELDORF_temp_range)) +
geom_point(alpha = 0.6, color = "orange") +
geom_smooth(method = "lm", color = "darkred", se = TRUE) +
labs(title = "Vplyv globálneho žiarenia na denný teplotný rozsah v Düsseldorfe",
subtitle = "Teplotný rozsah = Maximálna teplota - Minimálna teplota",
x = "Globálne žiarenie (W/m²)",
y = "Denný teplotný rozsah (°C)") +
theme_minimal()
par(mfrow = c(2,2))ZÁVER:
Na základe výsledkov lineárnej regresie rozhodne zamietame nulovú hypotézu H0 a prijímame alternatívnu hypotézu H1. Globálne žiarenie má štatisticky veľmi významný a silný vplyv na denný teplotný rozsah v Düsseldorfe.
Štatistické odôvodnenie:
p-hodnota < 2.2e-16 je extrémne významná, výrazne pod hranicou 0.05
t-hodnota 77.88 indikuje veľmi silnú evidenciu proti nulovej hypotéze
koeficient 3.45368 potvrdzuje pozitívny vplyv - so zvýšením globálneho žiarenia o 1 jednotku sa teplotný rozsah zvýši približne o 3.45°C
Interpretácia vzťahu:
Model vykazuje vynikajúcu vysvetľujúcu silu - R-squared 0.6242 znamená, že globálne žiarenie vysvetľuje 62.42% variability denného teplotného rozsahu. Toto je veľmi vysoká hodnota v meteorologických štúdiách.