Vnos podatkov

podatki <- data.frame("ID" = c(1, 2, 3, 4), 
                      "Višina" = c(165, 213, 190, 163),
                      "Starost" = c(25, 26, 27, 21),
                      "Spol" = c(0, 1, 1, 0))

print(podatki) #Izpis tabele s podatki
##   ID Višina Starost Spol
## 1  1    165      25    0
## 2  2    213      26    1
## 3  3    190      27    1
## 4  4    163      21    0
podatki[2, 2] <- 199
podatki[4, 3] <- 22

print(podatki) #Izpis tabele s podatki
##   ID Višina Starost Spol
## 1  1    165      25    0
## 2  2    199      26    1
## 3  3    190      27    1
## 4  4    163      22    0
podatki1 <- podatki[  ,  -3] #Izbriši 3. stolpec

podatki2 <- podatki[c(-3, -4) ,   ] #Izbriši 3 in 4. vrstico

podatki2 <- podatki[c(1, 2) ,   ] #Vključi samo 1 in 2. vrstico
podatki$Ocena <- c(9.1, 6.8, 7.5, 8.2)

print(podatki)
##   ID Višina Starost Spol Ocena
## 1  1    165      25    0   9.1
## 2  2    199      26    1   6.8
## 3  3    190      27    1   7.5
## 4  4    163      22    0   8.2
podatki$Starost <-  podatki$Starost - 1 #Spremenljivki smo odšteli vrednost 1
print(podatki)
##   ID Višina Starost Spol Ocena
## 1  1    165      24    0   9.1
## 2  2    199      25    1   6.8
## 3  3    190      26    1   7.5
## 4  4    163      21    0   8.2
summary(podatki[ , c(-1, -4) ]  ) #Opisna statistika za izbrane spremenljivke
##      Višina         Starost          Ocena      
##  Min.   :163.0   Min.   :21.00   Min.   :6.800  
##  1st Qu.:164.5   1st Qu.:23.25   1st Qu.:7.325  
##  Median :177.5   Median :24.50   Median :7.850  
##  Mean   :179.2   Mean   :24.00   Mean   :7.900  
##  3rd Qu.:192.2   3rd Qu.:25.25   3rd Qu.:8.425  
##  Max.   :199.0   Max.   :26.00   Max.   :9.100
mean(podatki$Višina)
## [1] 179.25
sd(podatki$Starost)
## [1] 2.160247
sapply(podatki[c(-1, -4)], FUN = var)
##      Višina     Starost       Ocena 
## 324.2500000   4.6666667   0.9666667
#install.packages("psych")
library(psych)

describe(podatki[c(-1, -4)])
##         vars n   mean    sd median trimmed   mad   min   max range  skew
## Višina     1 4 179.25 18.01 177.50  179.25 20.02 163.0 199.0  36.0  0.08
## Starost    2 4  24.00  2.16  24.50   24.00  1.48  21.0  26.0   5.0 -0.45
## Ocena      3 4   7.90  0.98   7.85    7.90  1.04   6.8   9.1   2.3  0.09
##         kurtosis   se
## Višina     -2.34 9.00
## Starost    -1.88 1.08
## Ocena      -2.04 0.49
#install.packages("pastecs")
library(pastecs)
round(stat.desc(podatki[c(-1, -4)]), 2)
##              Višina Starost Ocena
## nbr.val        4.00    4.00  4.00
## nbr.null       0.00    0.00  0.00
## nbr.na         0.00    0.00  0.00
## min          163.00   21.00  6.80
## max          199.00   26.00  9.10
## range         36.00    5.00  2.30
## sum          717.00   96.00 31.60
## median       177.50   24.50  7.85
## mean         179.25   24.00  7.90
## SE.mean        9.00    1.08  0.49
## CI.mean.0.95  28.65    3.44  1.56
## var          324.25    4.67  0.97
## std.dev       18.01    2.16  0.98
## coef.var       0.10    0.09  0.12