Podstawy R-wprowadzenie

PRZYDATNE SKRÓTY:

uruchomienie linijki kodu - ctrl + enter
zakomentowanie - ctrl + shift + c

KORZYSTANIE Z POMOCY (HELP)

?seq

## starting httpd help server ... done

PROSTE OBLICZENIA

a<-log(10)
b<-log(10,10)
a+b

## [1] 3.302585

a-b

## [1] 1.302585

a*b

## [1] 2.302585

a/b

## [1] 2.302585

GENEROWANIE CIĄGÓW

Ciąg liczb od 1 do 5

1:5

## [1] 1 2 3 4 5

Przypisanie do zmiennej “a” ciągu liczb od 1 do 30

a<-1:30
a1<-c(1:30)

Przypisanie do zmiennej “b” ciągu złożonego z 4 elemntów zmiennej jakościowej, gdzie “M” to mężczyzna, a “K” to kobieta

a1<-c("M", "K","M","K")

Dlugość ciągu

length(a)

## [1] 30

Generowanie ciągu składającego się z elemntów od 1 do 5 powtórzony 5 razy

rep(1:5,5) ### od 1 do 5 powtarzamy 5 razy

##  [1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

Generowanie ciągu skłądającego się z elementów od 1 do 5, gdzie każdy z elemntów jest powtórzony 2 razy

rep(1:5,each=2)

##  [1] 1 1 2 2 3 3 4 4 5 5

INDEKSOWANIE ELEMENTÓW CIĄGU

Wyświetlenie piątego elementów z ciągu “a”

####Indeksowanie- odnoszenie się do elementów####
a=seq(-1,1,length=10)
a

##  [1] -1.0000000 -0.7777778 -0.5555556 -0.3333333 -0.1111111  0.1111111
##  [7]  0.3333333  0.5555556  0.7777778  1.0000000

a[5]

## [1] -0.1111111

Wyświetlenie pierwszego i szóstego elementu z ciągu “a”

a[c(1,6)]

## [1] -1.0000000  0.1111111

Usunięcie pierwszego elementu z ciągu “a”

##  [1] -1.0000000 -0.7777778 -0.5555556 -0.3333333 -0.1111111  0.1111111
##  [7]  0.3333333  0.5555556  0.7777778  1.0000000

a[-1]

## [1] -0.7777778 -0.5555556 -0.3333333 -0.1111111  0.1111111  0.3333333
## [7]  0.5555556  0.7777778  1.0000000

Usunięcie drugiego i szóstego elementu z ciągu “a”

##  [1] -1.0000000 -0.7777778 -0.5555556 -0.3333333 -0.1111111  0.1111111
##  [7]  0.3333333  0.5555556  0.7777778  1.0000000

a[-c(2,6)]

## [1] -1.0000000 -0.5555556 -0.3333333 -0.1111111  0.3333333  0.5555556
## [7]  0.7777778  1.0000000

INSTALOWANIE PAKIETÓW

Instalowanie pakietu “readxl” zwierającego między innymi funkcję do otwierania plików o rozszerzeniu xlsx. Instalacje uruchamiamy raz!

#install.packages("readxl")

Załadowanie pakietu. Wywoałnie pakietu uruchamiane jest za każdym uruchomieniem R Studio

library(readxl)

Ładowanie zbioru za pomoca funkcji “read_excel”, znajdującej się w bibliotece “readxl” UWAGA! Prosze podać własną ścieżkę do danych. (Doane udostepnione zostały na zajęciach i znajdują się w plikach zespołu na MS Teams)

library(readxl)
dane <- read_excel("C:/Users/majko/OneDrive/Pulpit/Zajecia 2021-2022/Podypolomowe_2021-22/Dane_AW_zanieczyszczenie.xlsx", 
                                       sheet = "Dane")

Zamiana danych na data frame czyli ramkę danych

dane<-as.data.frame(dane)

Sprawdzenie typu zmiennych ze zbioru “dane”

str(dane)

## 'data.frame':    16 obs. of  8 variables:
##  $ Województwo: chr  "DOLNOŚLĄSKIE" "KUJAWSKO-POMORSKIE" "LUBELSKIE" "LUBUSKIE" ...
##  $ NO         : num  3.81 5.94 2.9 2.65 14.56 ...
##  $ CO         : num  2.55 7.46 2.78 2.41 12.72 ...
##  $ CO2        : num  4.4 4.45 2.38 2.14 16.14 ...
##  $ PYŁ %      : num  6.31 5.13 4.48 2.4 5.85 5.36 7.24 3.26 3.41 2.11 ...
##  $ PALIWA     : num  4.49 4.87 3.75 7.2 6.74 ...
##  $ ŚCIEKI     : num  7.99 7 2.74 2.62 5.27 ...
##  $ ZIELEŃ     : num  4.18 3.3 4.16 3.75 3.8 ...

INDEKSOWANIE- WYBÓR WIERSZY I KOLUMN

WYyświetlenie pierszego wiersza ze zbioru "dane:

dane [ 1, ]

Wyświetlenie drugiej kolumny ze zbioru “dane”

dane [ , 2]

##  [1]  3.813  5.936  2.903  2.655 14.561  4.432  5.463 13.284  2.254  1.992
## [11]  3.247  9.376 17.349  1.676  6.368  5.730

Wyświetlenie drugiego wiersza i trzeciej kolumny ze zbioru “dane”

dane [ 2,3]

## [1] 7.464

Wyodrębnienie pierwszej kolumny ze zbioru “dane” zawierającej nazwy województw. Przypisanie nazw województw do zmiennej “woje”

woje<-dane[ ,1]

Przypisanie nazw województw jako nazwy wierszy w ramce danych

row.names(dane)<-woje

Usunięcie kolumny z nazwami województw, która nie jest już potrzebna ze względu na przypisanie województw jako nazwy wierszy ramce danych

dane<-dane[,-1]

BIBLIOTEKA DPLYR

“Sciąga” z funkcjami - https://raw.githubusercontent.com/rstudio/cheatsheets/master/data-transformation.pdf

Wywołanie biblioteki

library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Wyświetlenie kolumny o nazwie “NO”

dane%>%
  select(NO)

Policzenie średniego zanieczyszczenia CO i CO2 dla poszczególnych województw

dane%>%
  select(CO, CO2)%>%
  mutate(srednia=(CO+CO2)/2) ## dodanie nowej kolumny

Uszeregowanie rosnąco wartości zmiennej NO

dane%>%
  select(NO)%>%
  arrange(NO)

Uszeregowanie malejąco wartości zmiennej NO

dane%>%
  select(NO)%>%
  arrange(desc(NO))

Wyliczenie średniego zanieczyszczenia NO

dane%>%
  select(NO)%>%
  summarise(srednia=mean(NO))

ZADANIE DOMOWE

Złączyć ciągi “a” i “b” w jeden aby otrzymać ciąg : 1,2,3,4,5,6

a<-1:3
b<-4:6
a

## [1] 1 2 3

## [1] 4 5 6

Zapoznanie się z funkjami biblioteki dplyr na bazie “iris”

iris

                                                                  Made by: 
                                                                  Majkowska Agata
                                                                  agata.majkowska@phdstud.ug.edu.pl