?seq
## starting httpd help server ... done
a<-log(10)
b<-log(10,10)
a+b
## [1] 3.302585
a-b
## [1] 1.302585
a*b
## [1] 2.302585
a/b
## [1] 2.302585
Ciąg liczb od 1 do 5
1:5
## [1] 1 2 3 4 5
Przypisanie do zmiennej “a” ciągu liczb od 1 do 30
a<-1:30
a1<-c(1:30)
Przypisanie do zmiennej “b” ciągu złożonego z 4 elemntów zmiennej jakościowej, gdzie “M” to mężczyzna, a “K” to kobieta
a1<-c("M", "K","M","K")
Dlugość ciągu
length(a)
## [1] 30
Generowanie ciągu składającego się z elemntów od 1 do 5 powtórzony 5 razy
rep(1:5,5) ### od 1 do 5 powtarzamy 5 razy
## [1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Generowanie ciągu skłądającego się z elementów od 1 do 5, gdzie każdy z elemntów jest powtórzony 2 razy
rep(1:5,each=2)
## [1] 1 1 2 2 3 3 4 4 5 5
Wyświetlenie piątego elementów z ciągu “a”
####Indeksowanie- odnoszenie się do elementów####
a=seq(-1,1,length=10)
a
## [1] -1.0000000 -0.7777778 -0.5555556 -0.3333333 -0.1111111 0.1111111
## [7] 0.3333333 0.5555556 0.7777778 1.0000000
a[5]
## [1] -0.1111111
Wyświetlenie pierwszego i szóstego elementu z ciągu “a”
a[c(1,6)]
## [1] -1.0000000 0.1111111
Usunięcie pierwszego elementu z ciągu “a”
a
## [1] -1.0000000 -0.7777778 -0.5555556 -0.3333333 -0.1111111 0.1111111
## [7] 0.3333333 0.5555556 0.7777778 1.0000000
a[-1]
## [1] -0.7777778 -0.5555556 -0.3333333 -0.1111111 0.1111111 0.3333333
## [7] 0.5555556 0.7777778 1.0000000
Usunięcie drugiego i szóstego elementu z ciągu “a”
a
## [1] -1.0000000 -0.7777778 -0.5555556 -0.3333333 -0.1111111 0.1111111
## [7] 0.3333333 0.5555556 0.7777778 1.0000000
a[-c(2,6)]
## [1] -1.0000000 -0.5555556 -0.3333333 -0.1111111 0.3333333 0.5555556
## [7] 0.7777778 1.0000000
Instalowanie pakietu “readxl” zwierającego między innymi funkcję do otwierania plików o rozszerzeniu xlsx. Instalacje uruchamiamy raz!
#install.packages("readxl")
Załadowanie pakietu. Wywoałnie pakietu uruchamiane jest za każdym uruchomieniem R Studio
library(readxl)
Ładowanie zbioru za pomoca funkcji “read_excel”, znajdującej się w bibliotece “readxl” UWAGA! Prosze podać własną ścieżkę do danych. (Doane udostepnione zostały na zajęciach i znajdują się w plikach zespołu na MS Teams)
library(readxl)
dane <- read_excel("C:/Users/majko/OneDrive/Pulpit/Zajecia 2021-2022/Podypolomowe_2021-22/Dane_AW_zanieczyszczenie.xlsx",
sheet = "Dane")
Zamiana danych na data frame czyli ramkę danych
dane<-as.data.frame(dane)
Sprawdzenie typu zmiennych ze zbioru “dane”
str(dane)
## 'data.frame': 16 obs. of 8 variables:
## $ Województwo: chr "DOLNOŚLĄSKIE" "KUJAWSKO-POMORSKIE" "LUBELSKIE" "LUBUSKIE" ...
## $ NO : num 3.81 5.94 2.9 2.65 14.56 ...
## $ CO : num 2.55 7.46 2.78 2.41 12.72 ...
## $ CO2 : num 4.4 4.45 2.38 2.14 16.14 ...
## $ PYŁ % : num 6.31 5.13 4.48 2.4 5.85 5.36 7.24 3.26 3.41 2.11 ...
## $ PALIWA : num 4.49 4.87 3.75 7.2 6.74 ...
## $ ŚCIEKI : num 7.99 7 2.74 2.62 5.27 ...
## $ ZIELEŃ : num 4.18 3.3 4.16 3.75 3.8 ...
WYyświetlenie pierszego wiersza ze zbioru "dane:
dane [ 1, ]
Wyświetlenie drugiej kolumny ze zbioru “dane”
dane [ , 2]
## [1] 3.813 5.936 2.903 2.655 14.561 4.432 5.463 13.284 2.254 1.992
## [11] 3.247 9.376 17.349 1.676 6.368 5.730
Wyświetlenie drugiego wiersza i trzeciej kolumny ze zbioru “dane”
dane [ 2,3]
## [1] 7.464
Wyodrębnienie pierwszej kolumny ze zbioru “dane” zawierającej nazwy województw. Przypisanie nazw województw do zmiennej “woje”
woje<-dane[ ,1]
Przypisanie nazw województw jako nazwy wierszy w ramce danych
row.names(dane)<-woje
Usunięcie kolumny z nazwami województw, która nie jest już potrzebna ze względu na przypisanie województw jako nazwy wierszy ramce danych
dane<-dane[,-1]
“Sciąga” z funkcjami - https://raw.githubusercontent.com/rstudio/cheatsheets/master/data-transformation.pdf
Wywołanie biblioteki
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Wyświetlenie kolumny o nazwie “NO”
dane%>%
select(NO)
Policzenie średniego zanieczyszczenia CO i CO2 dla poszczególnych województw
dane%>%
select(CO, CO2)%>%
mutate(srednia=(CO+CO2)/2) ## dodanie nowej kolumny
Uszeregowanie rosnąco wartości zmiennej NO
dane%>%
select(NO)%>%
arrange(NO)
Uszeregowanie malejąco wartości zmiennej NO
dane%>%
select(NO)%>%
arrange(desc(NO))
Wyliczenie średniego zanieczyszczenia NO
dane%>%
select(NO)%>%
summarise(srednia=mean(NO))
a<-1:3
b<-4:6
a
## [1] 1 2 3
b
## [1] 4 5 6
iris
Made by:
Majkowska Agata
agata.majkowska@phdstud.ug.edu.pl