Amra Fetahović
Sarajevo, 2024.
Unutrasnje migracije - konferencija Mignet - desno cirkularni plot u R-u
Ukupna stopa fertiliteta u BiH i gender nejednakost
USAID-MEASURE BIH Impact evaluation of Active labour market policy
Vise na:
http://measurebih.com i http://premisa.org
ko je instalirao neka otvori Rstudio ko nije zajedno da pratimo korake
#
hashtag nam omogucava da stavljamo tekst u script-i. R ga prepoznaje kao tekst te nam ne isporucuje Error. Probajte kucati tekst u scripti bez #
<-
Ovo je tzv. asign znak i pripisuje vrijednosti nekoj varijabli ili vektoru
$
Dolar se cesto upotrebljava, kada npr zelimo iz baze da izvucemo varijable. Lijevo od dolara je naziv dataframa a desno od $ je ime varijable
[]
srednja zagrada znaci indeksiranje. npr. ako zelimo da indeksiramo bazu podataka imamo dvije dimenzije: red i kolonu. prvo navedemo red pa zarez pa kolonu
()
male zagrade oznacavju funkciju. Dakle ono sto je u zagradi je odredjena funkcija. najcesce se korisit c() ali imamo beskonacno mnogo funkcija
==
,<=
,>=
,!=
,|
,%in%
ovi znakovi su logicki operatori. zadnji se odnosi na 'nije jednako kad imamo logicku funkciju npr. ifelse (), koju cemo kasnije obradjivati ' u setu'
=
se koristi kao znak jednako npr 'data=nameofdatabase' , unutar funkcija kao argument
,
zarez cesto koristimo kada odvajamo npr. red i kolonu kod indeksiranja odnosno selektiranja elementa. On je vrlo bitan cesto se zna izostaviti u pisanju funkcije pa dobijemo error.
{ }
viticasta zagrada se koristi kod programiranja tj funkcija koje pise korisnik
Varijable mogu biti
kvantitativne = c (1,5,8,10.5)
ikvalitativne = c(ucitelj, domar, higijenicar, direktor..)
,logicki = c(TRUE, TRUE, FALSE)
,datumi = c(31-12-2017)
Kvantitativne varijable su numericke i mogu biti discrete ili continuous. Npr. (1,2,3,) tj.dan u sedmici je discrete, a tezina je continuous. (continious imaju razlomke)
Discrete varijable su one koje mogu imati samo cijeli broj, ono sto nema frakcija, npr. broj ucenika u razredu, broj stanovnika u nekoj drzavi, broj stanova u zgradi. R ove varijable prepoznaje kao integer.
Continuous su numericke koje mogu uzeti bilo koji broj izmedju dva cijela broja. Npr. tezina, duzina, temperatura,..itd. R ove varijable prepoznaje kao numeric.
Kvalitativne varijable su kategoricke. Uzmimo npr. primjer varijable zanimanje. Kakvo zanimanje mozemo imati? Zanimanje moze biti: doktor, ucitelj, bankar, statisticar, sestra, cuvar itd. Ove varijable su kvalitativne jer ih ne mozemo posloziti po nivoima odnosno rangirati. Kvalitativne varijabe u R prepoznaje kao factor i kao character.
Karakter varijabla je tekstualna, u njoj mozemo imati zareze, recenice, ili kada je jedna obzervacije broj, druga slovo ili rijec R tu varijablu prepoznaje kao karakter.
Faktor varijable: Kada imamo faktore u bazi podataka moramo biti veoma pazljivi. Faktori su kategoricke varijable koji mogu biti i zamjenjeni brojem npr. 1 za muskarce i 2 za zene.
U tom slucaju moramo da damo do znanja R u da je 1 faktor a ne broj. U slucaju broja mozemo primjentit matematicke operacije a u slucaju factor ne mozemo nego samo frekvencije
PRVO: Otvoriti scriptu File - open file ili new script
DRUGO:stwd ()
ILI Session - Set Working Directory - Choose Directory ILI ctrl+shift+h
TRECE:install.packages ("naziv_paketa")
ako je potrebno, pa ondalibrary (naziv_paketa)
- pozovete pakete bez navodnika
CETVRTO: importovati bazu:read.csv ("df.csv")
PETO: OSTAVITE OSNOVNU BAZU DA BUDE MASTER, A NA KOJOJ RADITE PREIMENUJTE i npr.df1 <- df
SESTO: transformacije, formatiranje, analize npr.as.numeric ()
SEDMO: spasavanje bazewrite.csv (df1, "df1.csv")
#Prvo stari naziv pa novi
Indeksiranje: df[red, kolona] odnosno df[observacija, varijabla]
NA: Dodamo argumentna.rm=T
kada R nece da izracuna i prijavljue gresku radi NA
Tabele tabele mozemo pozvati na vise nacina i maksimalno dvije varijable da stavimo. obje varijable moraju biti kategoricketable (v1, v2)
ili prekocrosstab (df$var1, df$var2)
preko paketadescr
Tabele kateg + numer: ako zelimo i numericku varijabli ondaCreateTableOne (data=df, vars= c("var1", "var2"), strata = c("var3"))
preko paketatableone
Znakovi u cestoj upotrebi:<-
,$
,[]
,()