Zad 1. Utwórz wektor danych “ryzyko” oraz “wiek”. Każdy z nich ma mieć 10 obseracji, dowolne wartości. Ryzyko jako zmienna 0-1, wiek w latach.
Zad 2. Przekoduj ryzyko czynnik (factor): dla wieku >30 lat “0” o tykiecie “wysokie”, a dla pozostałych “1” o etykiecie “niskie”.
risk <- as.factor(ifelse(age > 30, 0, 1))
coder <- c(niskie=1, wysokie=0)
risk <- factor(risk, levels = coder, labels=names(coder))Zad3. Połącz wiek i ryzykow tworząc nową ramke dnaych o naziwe “ramka”. Posortuj obserwacje wg wieku (rosnąco).
Zad 4. Utwórz tablicę “tablica” z wieku i ryzyka o wymiarach 5x2x2.
Zadanie 5. Dokonaj pełnej analizy opisowej dla osób z grupy 1 oraz 2 (średnia, odchylenia, kwartyle, skośność, kurtoza).
for (i in c(1,2)){
for (j in c(1,2)){
srm<-mean(tablica[,j,i])
sdm<-sd(tablica[,j,i])
iqrm<-IQR(tablica[,j,i])
skem<-skewness(tablica[,j,i])
kurm<-kurtosis(tablica[,j,i])
print(sprintf("Grupa:%d, kolumna:%d, srednia:%f, sd:%f, iqr:%f, skosnosc:%f, kurtoza:%f", i, j, srm, sdm, iqrm, skem, kurm))
}
}## [1] "Grupa:1, kolumna:1, srednia:31.200000, sd:9.549869, iqr:6.000000, skosnosc:-1.142465, kurtoza:2.771638"
## [1] "Grupa:1, kolumna:2, srednia:1.800000, sd:0.447214, iqr:0.000000, skosnosc:-1.500000, kurtoza:3.250000"
## [1] "Grupa:2, kolumna:1, srednia:25.800000, sd:11.777096, iqr:19.000000, skosnosc:0.451037, kurtoza:1.324915"
## [1] "Grupa:2, kolumna:2, srednia:1.400000, sd:0.547723, iqr:1.000000, skosnosc:0.408248, kurtoza:1.166667"
grupa1<-tablica[,,1]
grupa2<-tablica[,,2]
srednie<-c(mean(grupa1), mean(grupa2))
odchylenie<-c(sd(grupa1), sd(grupa2))
kwartyle<-c(IQR(grupa1), IQR(grupa2))
skosnosc<-c(skewness(grupa1), skewness(grupa2))
kurtoza<-c(kurtosis(grupa1),kurtosis(grupa2))## Wiek Ryzyko
## Min. :15.0 Min. :1.0
## 1st Qu.:31.0 1st Qu.:2.0
## Median :34.0 Median :2.0
## Mean :31.2 Mean :1.8
## 3rd Qu.:37.0 3rd Qu.:2.0
## Max. :39.0 Max. :2.0
## Wiek Ryzyko
## Min. :16.0 Min. :1.0
## 1st Qu.:17.0 1st Qu.:1.0
## Median :19.0 Median :1.0
## Mean :25.8 Mean :1.4
## 3rd Qu.:36.0 3rd Qu.:2.0
## Max. :41.0 Max. :2.0
Zadanie 6. Przedstaw na histogramach oraz wykresach ramkowych rozkłady wieku osób z wysokiem i niskim ryzykiem kredytowym (porównanie - 2 wykresy obok siebie)
par(mfrow=c(1,2))
hist(ramka$age, prob=TRUE, main=("Histogram ilustrujacy zaleznosc \n ryzyka od wieku"), xlab="przedzial wiekowy", ylab="gestosc")
lines(density(ramka[as.numeric(risk)==1,1]),col="red")
lines(density(ramka[as.numeric(risk)==2,1]),col="blue")
legend("topright", legend=c("niskie","wysokie"), col=c("red", "blue"), bty="n", lty=1)
boxplot(ramka$age~ramka$risk, xlab="grupa ryzyka", ylab="wiek")
title("Boxplot zaleznosci wieku \n od ryzyka") Dodac legende odnosnie kolorow ryzyk(prawy dolny rog obrazka) i podspisac wykresy