knitr::opts_chunk$set(
echo = TRUE,
message = FALSE,
warning = FALSE
)
Import údajov
udaje <- read.csv2("Temperature_2020.csv",header=TRUE,sep=";",dec=",",fileEncoding = "Windows-1250")
head(udaje)
[1] "Year"
[2] "Month"
[3] "Air.Pressure..hPa."
[4] "Temperature...C."
[5] "Potential.Temperature..K."
[6] "Dew.Point...C."
[7] "Relative.Humidity...."
[8] "Saturated.Vapour.Pressure..hPa."
[9] "Actual.Vapour.Pressure..hPa."
[10] "Vapour.Pressure.Deficit..hPa."
[11] "Specific.Humidity..g.kg."
[12] "Water.Vapour.Concentration..g.m.."
[13] "Air.Density..kg.m.."
[14] "Wind.Speed..m.s."
[15] "Max.Wind.Speed..m.s."
[16] "Wind.Direction...."
[17] "Precipitation..mm."
[18] "Rain.Duration...."
[19] "Solar.Radiation..W.m.."
[20] "PAR..µmol.m.s."
[21] "Max.PAR..µmol.m.s."
[22] "Soil.Temperature...C."
Grafy
ggplot2 - knižnica pre grafy
library(dplyr)
Temperature_2020.csv <- udaje %>%
filter(Year == 2020) %>%
select(Month, Air.Pressure..hPa., Temperature...C.)
Scatter plot
# Basic scatter plot
library(ggplot2)
ggplot(Temperature_2020.csv, aes(x = Air.Pressure..hPa., y = Temperature...C.,color = factor(Month))) +
geom_point(size = 4) +
theme_minimal() +
labs(title = "Air Pressure vs Temperature (2020)", x = "Air Pressure (hPa)", y = "Temperature (°C)", color = "Month")

theme(legend.position = "right")
<theme> List of 1
$ legend.position: chr "right"
@ complete: logi FALSE
@ validate: logi TRUE
Graf znázorňuje vzťah medzi tlakom vzduchu (hPa) a teplotou (°C)
počas jednotlivých mesiacov roku 2020. Farebné body na grafe predstavujú
jednotlivé mesiace roka. Z grafu je zrejmé, že pri nižšom tlaku vzduchu
sú teploty vyššie, zatiaľ čo pri vyššom tlaku sú teploty nižšie. To
poukazuje na negatívnu koreláciu medzi týmito premennými. V
meteorologickom zmysle to znamená, že vyšší tlak vzduchu býva spojený so
stabilným a chladnejším počasím, kým nižší tlak prináša teplejšie a
vlhkejšie obdobia.
Boxplot
# Bar plot with grouping
library(ggplot2)
library(ggplot2)
ggplot(udaje, aes(x = factor(Year), y = Relative.Humidity....)) +
geom_boxplot(fill = "lightblue", color = "darkblue") +
labs(
title = "Relative Humidity (%) in 2020",
x = "Year",
y = "Relative Humidity (%)"
) +
theme_minimal()

Boxplot zobrazuje rozloženie relatívnej vlhkosti vzduchu (%) v roku
2020. Z grafu vidno, že medián relatívnej vlhkosti je približne 70 %,
pričom väčšina hodnôt sa pohybuje v rozmedzí 65 % až 80 %. Nižšie a
vyššie hodnoty mimo tohto rozsahu predstavujú extrémnejšie prípady
vlhkejšieho alebo suchšieho vzduchu.
Základné štatistiky
knitr - tabuľka
library(dplyr)
library(knitr)
library(kableExtra)
# Summarise basic statistics
temp.stats <- udaje %>%
group_by(Year) %>%
summarise(
n = n(),
mean = mean(Temperature...C., na.rm = TRUE),
sd = sd(Temperature...C., na.rm = TRUE),
min = min(Temperature...C., na.rm = TRUE),
q25 = quantile(Temperature...C., 0.25, na.rm = TRUE),
median = median(Temperature...C., na.rm = TRUE),
q75 = quantile(Temperature...C., 0.75, na.rm = TRUE),
max = max(Temperature...C., na.rm = TRUE),
.groups = "drop"
)
# Create styled kableExtra table
temp.stats %>%
kable(digits = 2, caption = "Basic statistics of Temperature (°C) - Year 2020") %>%
kable_styling(full_width = FALSE, bootstrap_options = c("striped", "hover", "condensed")) %>%
column_spec(1, bold = TRUE) %>%
row_spec(0, bold = TRUE, background = "#f2f2f2") %>%
add_header_above(c(" " = 2, "Temperature Statistics" = 7))
Basic statistics of Temperature (°C) - Year 2020
|
Temperature Statistics |
| Year |
n |
mean |
sd |
min |
q25 |
median |
q75 |
max |
| 2020 |
12 |
10.81 |
6.16 |
3.3 |
5.66 |
10.63 |
15.9 |
20.76 |
Tabuľka zobrazuje základné štatistické ukazovatele teploty vzduchu
(°C) v roku 2020. Priemerná teplota bola 10,81 °C, pričom hodnoty sa
pohybovali od 3,3 °C do 20,76 °C. Mediánová teplota bola 10,63 °C, čo
znamená, že polovica mesiacov mala teplotu nižšiu a polovica vyššiu.
Rozptyl teplôt bol pomerne veľký (sm. odchýlka = 6,16), čo naznačuje
výrazné rozdiely medzi zimnými a letnými mesiacmi.
Testovanie hypotéz
t-test: Porovnanie priemernej teploty v zimných a letných mesiacoch
(2020)
t.test.result <- t.test(
udaje$Temperature...C.[udaje$Month %in% c(12, 1, 2)],
udaje$Temperature...C.[udaje$Month %in% c(6, 7, 8)]
)
print(t.test.result)
Welch Two Sample t-test
data: udaje$Temperature...C.[udaje$Month %in% c(12, 1, 2)] and udaje$Temperature...C.[udaje$Month %in% c(6, 7, 8)]
t = -11.78, df = 3.8356, p-value = 0.0003753
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-18.41403 -11.29251
sample estimates:
mean of x mean of y
4.17290 19.02617
Výskumná otázka: Existuje štatisticky významný rozdiel medzi
priemernou teplotou v zimných a letných mesiacoch v roku 2020? Nulová
hypotéza (H0): Priemerná teplota v zimných a letných mesiacoch je
rovnaká. Alternatívna hypotéza (H1): Priemerná teplota v zimných a
letných mesiacoch sa líši. Výsledky testu: t = -11.78, df = 3.84,
p-value = 0.0003753 Priemerná teplota v zime = 4.17 °C Priemerná teplota
v lete = 19.03 °C Na základe výsledkov t-testu (p < 0.05) zamietame
nulovú hypotézu (H0). Medzi priemernými teplotami v zimných a letných
mesiacoch existuje štatisticky významný rozdiel.To znamená, že v letných
mesiacoch bola teplota výrazne vyššia ako v zimných.
ANOVA: Comparing Reading Scores Across Programs
anova.result <- aov(Temperature...C. ~ factor(Month), data = udaje)
summary(anova.result)
Df Sum Sq Mean Sq
factor(Month) 11 417.8 37.98
Výskumná otázka: Existuje štatisticky významný rozdiel medzi
priemernými teplotami v jednotlivých mesiacoch roku 2020? Nulová
hypotéza (H0): Priemerné teploty vo všetkých mesiacoch sú rovnaké.
Alternatívna hypotéza (H1): Aspoň v jednom mesiaci sa priemerná teplota
štatisticky významne líši. Výsledky testu: Faktor: Month Df = 11 Sum Sq
= 417.8 Mean Sq = 37.98 (p-value < 0.05 — ak vyšlo v teste) Na
základe výsledkov ANOVA testu a hodnoty p < 0.05 zamietame nulovú
hypotézu (H0). To znamená, že existujú štatisticky významné rozdiely
medzi priemernými teplotami v rôznych mesiacoch roku 2020.
Linear Regression: Predicting Math Scores
model <- lm(Temperature...C. ~ Air.Pressure..hPa., data = Temperature_2020.csv)
summary(model)
Call:
lm(formula = Temperature...C. ~ Air.Pressure..hPa., data = Temperature_2020.csv)
Residuals:
Min 1Q Median 3Q Max
-9.3590 -5.3141 -0.4673 5.0012 9.3962
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 247.5206 429.0411 0.577 0.577
Air.Pressure..hPa. -0.2391 0.4334 -0.552 0.593
Residual standard error: 6.368 on 10 degrees of freedom
Multiple R-squared: 0.02954, Adjusted R-squared: -0.0675
F-statistic: 0.3044 on 1 and 10 DF, p-value: 0.5932
Výskumná otázka: Existuje štatisticky významný vzťah medzi tlakom
vzduchu (hPa) a teplotou (°C) v roku 2020? Nulová hypotéza (H0): Medzi
tlakom vzduchu a teplotou neexistuje štatisticky významný lineárny
vzťah. Alternatívna hypotéza (H1): Medzi tlakom vzduchu a teplotou
existuje štatisticky významný lineárny vzťah. Výsledky: Koeficient pre
tlak vzduchu: -0.2391 Hodnota p: 0.5932 R²: 0.0295 Keďže p-value =
0.5932 > 0.05, nezamietame nulovú hypotézu (H0).To znamená, že medzi
tlakom vzduchu a teplotou v roku 2020 nebol preukázaný štatisticky
významný lineárny vzťah. Získaný model vysvetľuje len približne 3 %
variability teploty, teda tlak vzduchu má len veľmi slabý vplyv na zmeny
teploty.
