Primer 1

Tukaj pišem tekst, komentarje, naslove …

podatki <- data.frame("ID"=c(1,2,3,4), 
                      "Noga"=c(36,37,40,43),
                      "Starost"=c(25,26,19,22),
                      "Spol"=c("Z","Z","M","M"))

print(podatki)

##   ID Noga Starost Spol
## 1  1   36      25    Z
## 2  2   37      26    Z
## 3  3   40      19    M
## 4  4   43      22    M

Rad bi naredil novo tabelo s podatki, ki vsebuje samo ID, Starost in Spol

podatki2 <- podatki[ ,-2 ]

print(podatki2)

##   ID Starost Spol
## 1  1      25    Z
## 2  2      26    Z
## 3  3      19    M
## 4  4      22    M

Rad bi naredil novo tabelo s podatki, ki vključuje samo prvega in tretjega študenta

podatki3 <- podatki [c(-2,-4),  ]  #Izključim 2 in 4 enoto ...na listu imamo zapisano alternativo tega zapisa 

print(podatki3)

##   ID Noga Starost Spol
## 1  1   36      25    Z
## 3  3   40      19    M

podatki [1 , 2]<- 38  #Tukaj smo popravili podatek za številko noge...smo iz prvotne tabele iz stevilke 36 popravili, da ima ta oseba v resnici številko noge 38

print(podatki)

##   ID Noga Starost Spol
## 1  1   38      25    Z
## 2  2   37      26    Z
## 3  3   40      19    M
## 4  4   43      22    M

podatki$Visina <- c(160, 164,175.3, 179)  #Z znakom $ se ti avtomatsko naredi izbor spremnljivk in mi smo v prvotno tabelo želeli dodati še eno novo spremelnjivko Višina

print(podatki)

##   ID Noga Starost Spol Visina
## 1  1   38      25    Z  160.0
## 2  2   37      26    Z  164.0
## 3  3   40      19    M  175.3
## 4  4   43      22    M  179.0

podatki$Starost1<-podatki$Starost +1 #Će pa bi pri prvi zapisnai Starosti napisali brez 1 bi se pa naš drugi stolpec povozil in bi se številke spremenile, tako smo pa nov stolpec naredili

print(podatki)

##   ID Noga Starost Spol Visina Starost1
## 1  1   38      25    Z  160.0       26
## 2  2   37      26    Z  164.0       27
## 3  3   40      19    M  175.3       20
## 4  4   43      22    M  179.0       23

summary(podatki[ , c(-1,-4) ])  #SUMMARY = opisna statistika, ID in spol smo odstranili, saj ni smiselno imet opisne za tedve...starost max 26 (razložimo= maksimalna starost je 26, 1st q pri visini =1/4 je bila do vklljučno 163.0, preostalih 75% pa višja )

##       Noga          Starost          Visina         Starost1    
##  Min.   :37.00   Min.   :19.00   Min.   :160.0   Min.   :20.00  
##  1st Qu.:37.75   1st Qu.:21.25   1st Qu.:163.0   1st Qu.:22.25  
##  Median :39.00   Median :23.50   Median :169.7   Median :24.50  
##  Mean   :39.50   Mean   :23.00   Mean   :169.6   Mean   :24.00  
##  3rd Qu.:40.75   3rd Qu.:25.25   3rd Qu.:176.2   3rd Qu.:26.25  
##  Max.   :43.00   Max.   :26.00   Max.   :179.0   Max.   :27.00

#PRVI KOLOKVIJ = OSNOVNA ANALIZA PODATKOV V R, RAZLAGAL BOS KOEFIECIENTE

mean(podatki$Starost)  #mean smo hoteli zračunat za starost in smo mu morlai povedat kje se starost nahaja (prvotna tabela podatki in z znakom $ izbrali med našimi spremeljivkami)

## [1] 23

sd(podatki$Visina)  #Standardni odklon za Višino

## [1] 9.025289

#install.packages("psych")  
#naložimo knjižnico psyche v kateri je funkcija describe, moramo jo še aktivirati gled desno spodaj pod packeges katere imajo kljukice in ko jo aktiviras se avtomatsko doda kljukica...# pred install damo da nebo vedno znova in znova nameščal

library(psych)   #tako aktiviramo

describe(podatki)  #zopet opisna statistika ampak malo drugače predstavljena

##          vars n   mean   sd median trimmed   mad min max range  skew kurtosis
## ID          1 4   2.50 1.29   2.50    2.50  1.48   1   4     3  0.00    -2.08
## Noga        2 4  39.50 2.65  39.00   39.50  2.22  37  43     6  0.32    -2.01
## Starost     3 4  23.00 3.16  23.50   23.00  2.97  19  26     7 -0.24    -2.12
## Spol*       4 4   1.50 0.58   1.50    1.50  0.74   1   2     1  0.00    -2.44
## Visina      5 4 169.57 9.03 169.65  169.57 11.12 160 179    19 -0.01    -2.31
## Starost1    6 4  24.00 3.16  24.50   24.00  2.97  20  27     7 -0.24    -2.12
##            se
## ID       0.65
## Noga     1.32
## Starost  1.58
## Spol*    0.29
## Visina   4.51
## Starost1 1.58

#skew pri nogi 0.32 a je asimetrična v desno ali levo? - gledas koeficient asimetrije, je asimetrija v desno

#install.packages("pastecs")

library(pastecs)  #aktiviras

round(stat.desc(podatki[,c(-1,-4)]),2)  #round pomeni zaokroži? ...smo želeli dati dve ven in ostale dan na dve decimalki

##                Noga Starost Visina Starost1
## nbr.val        4.00    4.00   4.00     4.00
## nbr.null       0.00    0.00   0.00     0.00
## nbr.na         0.00    0.00   0.00     0.00
## min           37.00   19.00 160.00    20.00
## max           43.00   26.00 179.00    27.00
## range          6.00    7.00  19.00     7.00
## sum          158.00   92.00 678.30    96.00
## median        39.00   23.50 169.65    24.50
## mean          39.50   23.00 169.57    24.00
## SE.mean        1.32    1.58   4.51     1.58
## CI.mean.0.95   4.21    5.03  14.36     5.03
## var            7.00   10.00  81.46    10.00
## std.dev        2.65    3.16   9.03     3.16
## coef.var       0.07    0.14   0.05     0.13

Primer 1

2023-10-07