Gruppitöö_R ‘Gapminder.xlxs’ analiseerimine

install.packages('tidyverse')
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.5'
## (as 'lib' is unspecified)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.1     ✔ stringr   1.6.0
## ✔ ggplot2   4.0.0     ✔ tibble    3.3.0
## ✔ lubridate 1.9.4     ✔ tidyr     1.3.1
## ✔ purrr     1.2.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(readxl)
df <- read_excel("/cloud/project/g15/gapminder.xlsx")
#View(df)

1.Hiina rahvraarv aastal 2007

hiina_2007 <- df %>% 
  filter(country == "China", year == 2007) %>% 
  select(pop)
#View(hiina_2007)

Hiina rahvaarv aastal 2007 oli 1318683096

2.Euroopa rahvaarv aastal 2002

euroopa_2002 <- df %>% 
  filter(continent == "Europe", year == 2002) %>% 
  select(country, pop) %>% 
  mutate(pop_miljonites = pop / 1e6)

#View(euroopa_2002)

Euroopa riigid kõik koos

euroopa_2002_sum <- df %>% 
  filter(continent == "Europe", year == 2002) %>% 
  summarise(kogu_euroopa_2002_sum_rahvaarv = sum(pop/1e6))

#View(euroopa_2002_sum)

Kogu Euroopa arv oli 578.2239 aastal 2002

3.Mis aastal ja mis riigis oli kõige pikem eeldatav eluiga

kõige_pikem_eeldatav_eluiga <- df %>%
  select(country, year, lifeExp) %>%
  arrange(desc(lifeExp)) %>%
  slice(1:3)
  
#View(kõige_pikem_eeldatav_eluiga)

Jaapanis aastal 2007 oli kõige pikem eeldatav eluiga 82.603; 2.Hong Kongis aastal 2007 oli kõige pikem eeldatav eluiga 82.208; 3.Jaapanis aastal 2002 oli kõige pikem eeldatav eluiga 82.000.

4.Kõige kõrgem keskmise elueaga riik

kõige_kõrgem_keskmise_elueaga_riik <- df %>%
  select(country, lifeExp) %>%
  group_by(country) %>%
  summarise(kõige_kõrgem_eluiga = mean(lifeExp)) %>%
  arrange(desc(kõige_kõrgem_eluiga)) %>%
  slice(1:3)

#View(kõige_kõrgem_keskmise_elueaga_riik)
Kõige kõrgem keskmise elueaga riigid on Island (76.51142), Rootsi (76.17700),Norra (75.84300)
ggplot(kõige_kõrgem_keskmise_elueaga_riik,
       aes(x = kõige_kõrgem_eluiga,
           y = reorder(country, kõige_kõrgem_eluiga))) +
  geom_point(size = 6, color = "steelblue") +
  geom_text(aes(label = round(kõige_kõrgem_eluiga, 1)),
            nudge_x = 0.4, size = 5) +
  labs(
    title = "Kõige kõrgema keskmise elueaga riigid",
    x = "Keskmine eluiga",
    y = "Riik"
  ) +
  theme_minimal(base_size = 14)

ggplot(kõige_pikem_eeldatav_eluiga,
       aes(x = lifeExp,
           y = reorder(country, lifeExp))) +
  geom_point(size = 6, color = "steelblue") +
  geom_text(aes(label = year), nudge_x = 0.3, size = 5) +
  labs(
    title = "Kõige pikema eeldatava elueaga riigid",
    x = "Eluiga",
    y = "Riik"
  ) +
  theme_minimal(base_size = 14)

ggplot(euroopa_2002_sum, aes(x = "", y = kogu_euroopa_2002_sum_rahvaarv)) +
  geom_col(fill = "steelblue") +
  coord_polar("y") +
  geom_text(aes(label = paste0(round(kogu_euroopa_2002_sum_rahvaarv, 1), " mln")),
            size = 6, color = "white") +
  labs(
    title = "Euroopa rahvaarv 2002. aastal"
  ) +
  theme_void()

ggplot(hiina_2007, aes(x = "China", y = pop / 1e6)) +  # делим на миллионы
  geom_col(fill = "lightblue") +
  geom_text(aes(label = paste0(round(pop / 1e6,1), " mln")), vjust = -0.5, size = 4) +
  labs(
    title = "Hiina rahvaarv 2007. aastal",
    x = "",
    y = "Rahvaarv (miljonites)"
  ) +
  theme_minimal(base_size = 10)