Tukaj pišem teks, komentarje, naslove,..
podatki <- data.frame("ID" = c(1, 2, 3, 4),
"Noga" = c(36, 37, 40, 43),
"Starost" = c(25, 26, 19, 22),
"Spol" = c("Z", "Z", "M", "M") )
print(podatki)
## ID Noga Starost Spol
## 1 1 36 25 Z
## 2 2 37 26 Z
## 3 3 40 19 M
## 4 4 43 22 M
Rad bi naredil novo tabelo s podatki, ki vsebuje samo ID, Starost in Spol.
podatki2 <- podatki[ ,-2 ]
print(podatki2)
## ID Starost Spol
## 1 1 25 Z
## 2 2 26 Z
## 3 3 19 M
## 4 4 22 M
Rad bi naredil novo tabelo s podatki, ki vključuje samo 1 in 3 študenta.
podatki3 <- podatki[c(-2, -4) , ] #izključimo 2 in 4 enoto
podatki3 <- podatki[c(1, 3) , ] #vključimo 1 in 3 enoto
print(podatki3)
## ID Noga Starost Spol
## 1 1 36 25 Z
## 3 3 40 19 M
podatki[1, 2] <- 38 #spremenili smo 36 v 38
print(podatki)
## ID Noga Starost Spol
## 1 1 38 25 Z
## 2 2 37 26 Z
## 3 3 40 19 M
## 4 4 43 22 M
podatki$Visina <- c(160, 164, 175.3, 179)
print(podatki)
## ID Noga Starost Spol Visina
## 1 1 38 25 Z 160.0
## 2 2 37 26 Z 164.0
## 3 3 40 19 M 175.3
## 4 4 43 22 M 179.0
podatki$Starost1 <- podatki$Starost + 1
print(podatki)
## ID Noga Starost Spol Visina Starost1
## 1 1 38 25 Z 160.0 26
## 2 2 37 26 Z 164.0 27
## 3 3 40 19 M 175.3 20
## 4 4 43 22 M 179.0 23
summary(podatki[ , c(-1, -4) ])
## Noga Starost Visina Starost1
## Min. :37.00 Min. :19.00 Min. :160.0 Min. :20.00
## 1st Qu.:37.75 1st Qu.:21.25 1st Qu.:163.0 1st Qu.:22.25
## Median :39.00 Median :23.50 Median :169.7 Median :24.50
## Mean :39.50 Mean :23.00 Mean :169.6 Mean :24.00
## 3rd Qu.:40.75 3rd Qu.:25.25 3rd Qu.:176.2 3rd Qu.:26.25
## Max. :43.00 Max. :26.00 Max. :179.0 Max. :27.00
1st Qu.:163.0 = četrtina ljudi v vzorcu je bila visokih do vključno 163 cm, preostalih 75% pa višja.
mean(podatki$Starost)
## [1] 23
sd(podatki$Visina)
## [1] 9.025289
#install.packages("psych") tega ne bo R več pognal, da ne bo vedno znova nalagal knjižnice na komp. Samo pognat jo moramo.
library(psych)
## Warning: package 'psych' was built under R version 4.3.3
describe(podatki)
## vars n mean sd median trimmed mad min max range skew kurtosis
## ID 1 4 2.50 1.29 2.50 2.50 1.48 1 4 3 0.00 -2.08
## Noga 2 4 39.50 2.65 39.00 39.50 2.22 37 43 6 0.32 -2.01
## Starost 3 4 23.00 3.16 23.50 23.00 2.97 19 26 7 -0.24 -2.12
## Spol* 4 4 1.50 0.58 1.50 1.50 0.74 1 2 1 0.00 -2.44
## Visina 5 4 169.57 9.03 169.65 169.57 11.12 160 179 19 -0.01 -2.31
## Starost1 6 4 24.00 3.16 24.50 24.00 2.97 20 27 7 -0.24 -2.12
## se
## ID 0.65
## Noga 1.32
## Starost 1.58
## Spol* 0.29
## Visina 4.51
## Starost1 1.58
#install.packages("pastecs")
library(pastecs)
## Warning: package 'pastecs' was built under R version 4.3.3
round( stat.desc (podatki [ , c(-1, -4) ] ), -2)
## Noga Starost Visina Starost1
## nbr.val 0 0 0 0
## nbr.null 0 0 0 0
## nbr.na 0 0 0 0
## min 0 0 200 0
## max 0 0 200 0
## range 0 0 0 0
## sum 200 100 700 100
## median 0 0 200 0
## mean 0 0 200 0
## SE.mean 0 0 0 0
## CI.mean.0.95 0 0 0 0
## var 0 0 100 0
## std.dev 0 0 0 0
## coef.var 0 0 0 0