OLC R YAZILIMINA GIRIS

class: center, middle, inverse, title-slide

# OLC R YAZILIMINA GIRIS
## apply ailesi
### 👩‍🏫 Dr. Kübra ATALAY KABASAKAL Hacettepe Üniversitesi
### 20/12/2021 📧 <a href="mailto:katalay@hacettepe.edu.tr" class="email">katalay@hacettepe.edu.tr</a>

---

# apply ailesi .huge[📊]

.hand[İçerik...]

-  apply()
-  lapply()
-  sapply()
-  vapply()
-  mapply()
-  rapply()
-  tapply() 
---

## apply() Fonksiyonu

- **apply()** fonksiyonu matris ve dizilerde satır ve sütundaki değerlerin 
belirlenen fonksiyona göre değerlerini özetlemek için kullanılır.

- **apply()** fonksiyonunun genel kullanımı

`$apply(x, margin, FUN, …)$`

- margin argümanı satır (1), sütun (2) veya her ikisini (c(1,2))
FUN argümanı ise uygulanacak fonksiyonu belirtmektedir.

---

## apply() Fonksiyonu

```r
X = matrix(c(1:9), nr= 3, byrow = T)
X
```

```
##      [,1] [,2] [,3]
## [1,]    1    2    3
## [2,]    4    5    6
## [3,]    7    8    9
```

```r
#1 satirlar icin, 
apply(X, 1, mean) # satir ortalamaları
```

```
## [1] 2 5 8
```

```r
#2 sutunlar icin
apply(X, 2, mean) # sutun ortalamaları
```

```
## [1] 4 5 6
```

---

## apply() Fonksiyonu

- Ortalaması 50, standart sapması 5 olan normal dağılıma sahip 100 elemanlı
"S1" vektöründen 20 satırlı ve 5 sütunlu matrisin oluşturulması

```r
set.seed(12)
S1 <- sample(rnorm(10000, 50, 5), 100, replace=TRUE)
Matris1 <- matrix(S1, nrow=20, ncol=5)
```

--
- `mean()` fonksiyonunun "Matris1" nesnesinin her bir sütununa uygulanarak  sütunların ortalamasının alınması

```r
apply(Matris1, 2, mean) # Fonksiyonun ikinci girdisi olan 2  sütun elamanlarını temsil etmektedir.
```

```
## [1] 48.20485 52.13701 49.38658 50.61689 48.60479
```

---
## apply() Fonksiyonu

- `summary()` fonksiyonunun "Matris1" nesnesinin her bir sütununa uygulanması

```r
apply(Matris1, 2, summary)
```

```
##             [,1]     [,2]     [,3]     [,4]     [,5]
## Min.    39.00080 40.23309 39.04749 39.32974 37.74364
## 1st Qu. 45.21933 48.44165 45.57123 47.36401 43.71252
## Median  49.31295 52.24410 49.49029 51.08794 47.62144
## Mean    48.20485 52.13701 49.38658 50.61689 48.60479
## 3rd Qu. 52.40540 55.97719 52.70180 54.36235 53.32016
## Max.    55.24910 63.33272 58.88203 59.93019 60.51715
```

---
## apply() Fonksiyonu

- `summary()` fonksiyonunun "Matris1" nesnesinin her bir satırına uygulanması

```r
apply(Matris1, 1, summary)
```

```
##             [,1]     [,2]     [,3]     [,4]     [,5]     [,6]     [,7]     [,8]
## Min.    45.82396 39.16789 51.63544 40.23309 39.04749 44.81304 39.73637 51.11418
## 1st Qu. 47.78055 39.32974 52.46878 43.82775 47.16408 47.46234 46.19462 51.96290
## Median  48.36804 46.24689 53.43269 47.65095 49.56534 49.64774 49.12984 52.65739
## Mean    50.47126 45.82933 54.50679 47.52181 48.65629 52.22224 50.10067 54.92558
## 3rd Qu. 54.95931 51.70256 56.11501 49.31343 52.65050 59.25790 55.94640 55.56069
## Max.    55.42443 52.69959 58.88203 56.58380 54.85404 59.93019 59.49613 63.33272
##             [,9]    [,10]    [,11]    [,12]    [,13]    [,14]    [,15]    [,16]
## Min.    44.96852 39.00080 43.36682 48.42947 42.13211 42.73818 40.55680 41.37856
## 1st Qu. 48.34900 48.83882 52.38428 50.17014 48.46619 46.50319 43.21988 42.18138
## Median  52.21976 53.65437 52.38428 51.40809 48.88713 50.98943 45.46715 47.83169
## Mean    50.61489 50.35382 51.18599 53.07152 50.44334 49.60777 46.24742 47.67032
## 3rd Qu. 53.31388 54.20555 52.91266 54.83276 55.24910 51.36429 46.82348 50.54044
## Max.    54.22331 56.06955 54.88190 60.51715 57.48218 56.44375 55.16980 56.41952
##            [,17]    [,18]    [,19]    [,20]
## Min.    40.53528 40.55680 37.74364 46.71473
## 1st Qu. 46.04637 44.03153 47.73063 49.31247
## Median  47.98124 44.46635 49.30321 51.96828
## Mean    48.55872 45.45876 47.52113 50.83282
## 3rd Qu. 49.85073 46.40143 50.16318 52.82962
## Max.    58.37998 51.83770 52.66500 53.33901
```

---
## apply() Fonksiyonu

- kisisel tanımlı fonksiyon ile kullanılması

- Kullanıcı tanımlı fonksiyonların **apply()** fonksiyonuna uygulanması

- Yazılan **bagil_degiskenlik()** fonksiyonunun "Matris1" nesnesinin 
her bir sütununa uygulanarak her bir değişkenin bağıl değişkenlik 
katsayısının hesaplanması

```r
bagil_degiskenlik <- function(x){
(sd(x)/mean(x))*100
}
apply(Matris1, 2, bagil_degiskenlik)
```

```
## [1] 11.24914 10.05771 11.02709 10.59998 12.97312
```

---
## apply() Fonksiyonu

Adsız (anonymous) fonksiyonlar  ile kullanılması

```r
apply(Matris1, 2, function(x){(sd(x)/mean(x))*100})
```

```
## [1] 11.24914 10.05771 11.02709 10.59998 12.97312
```

---

## lapply() Fonksiyonu

- **lapply()** fonksiyonu **apply()** fonksiyonunun listeler (list-apply), 
vektörler ve veri setleri için özelleşmiş halidir.

- Liste yapısında olduğu için satır veya sütuna ilişkin bir argüman kullanılmaz.

- **lappy()** fonksiyonu veri setlerinde kullanıldığında, sütundaki her bir değişkeni listenin elemanı olarak alır.

---

## lapply() Fonksiyonu

`lappy()` fonksiyonuyla elde edilen çıktılar da liste şeklindedir. 
`lapply()` fonksiyonunun genel kullanımı `$$lapply(x, FUN, …)$$`

```r
# liste olusturma
(mylist <- list(a=(1:10), b=(45:77)))
```

```
## $a
##  [1]  1  2  3  4  5  6  7  8  9 10
## 
## $b
##  [1] 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69
## [26] 70 71 72 73 74 75 76 77
```

```r
# liste elemalarını toplama
(resultlapply <- lapply(mylist, sum))
```

```
## $a
## [1] 55
## 
## $b
## [1] 2013
```

---
## lapply() Fonksiyonu

```r
liste <- list(a=c(1,2,3),b=c(4,5,6))
lapply(liste, function(x){x^(3/2)})
```

```
## $a
## [1] 1.000000 2.828427 5.196152
## 
## $b
## [1]  8.00000 11.18034 14.69694
```

---
## sapply() Fonksiyonu

- `sapply()` fonksiyonu `lapply()` fonksiyonu gibi liste, 
listelerin özelleşmiş hali olan veri setleri ve vektörler
üzerinde çalışır.

- `sapply()` fonksiyonunun temel amacı çıktıları basitleştirmektir.

- `lapply()` fonksiyonuyla elde edilen çıktılar liste biçimindeyken `sapply()` fonksiyonuyla elde edilen çıktılar daha çok vektör şeklindedir.

---
## sapply() Fonksiyonu

- `sapply()` fonksiyonu `apply()` fonksiyonuyla benzer çıktılar verir ancak `sapply()` fonksiyonunda margin değerleri bulunmaz. 
- `sapply()` fonksiyonunun genel kullanımı

```r
mylist <- list(a=(1:10), b=(45:77))

resultsapply <- sapply(mylist, sum)
resultsapply
```

```
##    a    b 
##   55 2013
```

---
## lapply() Fonksiyonu

```r
# lapply() fonksiyonunun liste veri türüne uygulanması
lapply(list(a=c(1,2,3)), mean) # Liste çıktısı vermektedir.
```

```
## $a
## [1] 2
```

---
## lapply() Fonksiyonu

```r
# lapply() fonksiyonunun çıktısının vektöre dönüştürülmesi
unlist(lapply(list(a=c(1,2,3)), mean))
```

```
## a 
## 2
```

---
## sapply() Fonksiyonu

```r
# sapply() fonksiyonunun liste veri türüne uygulanması
sapply(list(a=c(1,2,3)), mean) # Çıktı adlandırılmış vektör şeklindedir.
```

```
## a 
## 2
```

---
## tapply() Fonksiyonu

- `tapply()`  fonksiyonun temel görevi verileri belirlenen grup veya faktör değişkenine göre özetlemektir.

- Fonksiyonda bulunan x argümanı vektör, veri seti ve liste şeklindeki nesneleri, index argümanı "x" nesnesinin altboyut, grup veya faktör değişkenini, FUN argümanı ise uygulanacak fonksiyonu belirtir.

- `$tapply(x, Index, FUN, …)$`

---
## tapply() Fonksiyonu

- `tapply()` liste ve veri seti yapısındaki nesnelere uygulandığında, grup veya faktör değişkenine ilişkin fonksiyon değerlerini fonksiyon türüne gore vektör ya da liste şeklinde verir.

- Eğer `tapply()` içinde kullanılan fonksiyon tek bir değer veriyorsa, çıktı vektör; birden fazla değer veriyorsa, çıktı liste yapısındadır.

---

## tapply() Fonksiyonu

```r
isim <- c("Ali","Elif","Su","Deniz","Aras","Berk","Can","Ece","Efe","Arda")
boy <- c(160,165,170,155,167,162,169,158,160,164)
kilo <- c(55,55,57,50,48,65,58,62,45,47)
cinsiyet <- c("erkek","kadin","kadin","kadin","erkek",
"erkek","erkek","kadin","erkek","erkek")
cinsiyet <- factor(cinsiyet)
beden <- c("S","M","S","M","S","L","M","L","S","S")
beden <- factor(beden)
# tapply() fonksiyonunun liste veri yapısına uygulanması
Liste <- list(isim=isim,boy=boy,cinsiyet=cinsiyet,beden=beden,kilo=kilo)

tapply(Liste$boy, Liste$cinsiyet, sort)
```

```
## $erkek
## [1] 160 160 162 164 167 169
## 
## $kadin
## [1] 155 158 165 170
```

```r
tapply(Liste$boy, Liste$cinsiyet, sort, decreasing=TRUE)
```

```
## $erkek
## [1] 169 167 164 162 160 160
## 
## $kadin
## [1] 170 165 158 155
```

---

## tapply() Fonksiyonu

# tapply(df$boy, Liste$cinsiyet, sort)
# 
# tapply(df$boy, Liste$cinsiyet, sort, decreasing=TRUE)

# tapply(df$boy, Liste$cinsiyet, mean)
# 
# tapply(df$boy, Liste$cinsiyet, mean)
```

---

## by() Fonksiyonu

# by(df$boy, Liste$cinsiyet, sort)
# 
# by(df$boy, Liste$cinsiyet, sort, decreasing=TRUE)

# by(df$boy, Liste$cinsiyet, mean)
# 
# by(df$boy, Liste$cinsiyet, mean)
```