Gruppitöö_R ‘Gapminder.xlxs’ analiseerimine
install.packages('tidyverse')
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.5'
## (as 'lib' is unspecified)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.1 ✔ stringr 1.6.0
## ✔ ggplot2 4.0.0 ✔ tibble 3.3.0
## ✔ lubridate 1.9.4 ✔ tidyr 1.3.1
## ✔ purrr 1.2.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(readxl)
df <- read_excel("/cloud/project/g15/gapminder.xlsx")
#View(df)
1.Hiina rahvraarv aastal 2007
hiina_2007 <- df %>%
filter(country == "China", year == 2007) %>%
select(pop)
#View(hiina_2007)
Hiina rahvaarv aastal 2007 oli 1318683096
2.Euroopa rahvaarv aastal 2002
euroopa_2002 <- df %>%
filter(continent == "Europe", year == 2002) %>%
select(country, pop) %>%
mutate(pop_miljonites = pop / 1e6)
#View(euroopa_2002)
Euroopa riigid kõik koos
euroopa_2002_sum <- df %>%
filter(continent == "Europe", year == 2002) %>%
summarise(kogu_euroopa_2002_sum_rahvaarv = sum(pop/1e6))
#View(euroopa_2002_sum)
Kogu Euroopa arv oli 578.2239 aastal 2002
3.Mis aastal ja mis riigis oli kõige pikem eeldatav eluiga
kõige_pikem_eeldatav_eluiga <- df %>%
select(country, year, lifeExp) %>%
arrange(desc(lifeExp)) %>%
slice(1:3)
#View(kõige_pikem_eeldatav_eluiga)
Jaapanis aastal 2007 oli kõige pikem eeldatav eluiga 82.603; 2.Hong Kongis aastal 2007 oli kõige pikem eeldatav eluiga 82.208; 3.Jaapanis aastal 2002 oli kõige pikem eeldatav eluiga 82.000.
4.Kõige kõrgem keskmise elueaga riik
kõige_kõrgem_keskmise_elueaga_riik <- df %>%
select(country, lifeExp) %>%
group_by(country) %>%
summarise(kõige_kõrgem_eluiga = mean(lifeExp)) %>%
arrange(desc(kõige_kõrgem_eluiga)) %>%
slice(1:3)
#View(kõige_kõrgem_keskmise_elueaga_riik)
Kõige kõrgem keskmise elueaga riigid on Island (76.51142), Rootsi (76.17700),Norra (75.84300)
ggplot(kõige_kõrgem_keskmise_elueaga_riik,
aes(x = kõige_kõrgem_eluiga,
y = reorder(country, kõige_kõrgem_eluiga))) +
geom_point(size = 6, color = "steelblue") +
geom_text(aes(label = round(kõige_kõrgem_eluiga, 1)),
nudge_x = 0.4, size = 5) +
labs(
title = "Kõige kõrgema keskmise elueaga riigid",
x = "Keskmine eluiga",
y = "Riik"
) +
theme_minimal(base_size = 14)
ggplot(kõige_pikem_eeldatav_eluiga,
aes(x = lifeExp,
y = reorder(country, lifeExp))) +
geom_point(size = 6, color = "steelblue") +
geom_text(aes(label = year), nudge_x = 0.3, size = 5) +
labs(
title = "Kõige pikema eeldatava elueaga riigid",
x = "Eluiga",
y = "Riik"
) +
theme_minimal(base_size = 14)
ggplot(euroopa_2002_sum, aes(x = "", y = kogu_euroopa_2002_sum_rahvaarv)) +
geom_col(fill = "steelblue") +
coord_polar("y") +
geom_text(aes(label = paste0(round(kogu_euroopa_2002_sum_rahvaarv, 1), " mln")),
size = 6, color = "white") +
labs(
title = "Euroopa rahvaarv 2002. aastal"
) +
theme_void()
ggplot(hiina_2007, aes(x = "China", y = pop / 1e6)) + # делим на миллионы
geom_col(fill = "lightblue") +
geom_text(aes(label = paste0(round(pop / 1e6,1), " mln")), vjust = -0.5, size = 4) +
labs(
title = "Hiina rahvaarv 2007. aastal",
x = "",
y = "Rahvaarv (miljonites)"
) +
theme_minimal(base_size = 10)