Temel İstatistik ve
Hesaplamalar
- Temel istatistik ve hesaplamalar, finansal verilerin analizinde
önemli bir rol oynar.
- Ortalama, medyan, varyans, standart sapma gibi temel istatistikler,
verilerin merkezi eğilimini ve dağılımını anlamamıza yardımcı olur.
- Finansal verilerde, getiriler, volatilite ve korelasyon gibi
kavramlar da temel istatistik ve hesaplamalarla ifade edilir.
- R, bu tür istatistiksel analizler için geniş bir fonksiyon yelpazesi
sunar.
- Örneğin,
mean(), median(),
var(), sd() gibi fonksiyonlar, temel
istatistikleri hesaplamak için kullanılır.
- Ayrıca,
cor() fonksiyonu ile değişkenler arasındaki
korelasyonu hesaplayabiliriz.
- Finansal verilerin analizinde, bu temel istatistik ve hesaplamalar,
risk yönetimi, portföy optimizasyonu ve performans değerlendirmesi gibi
alanlarda kritik öneme sahiptir.
- Bu nedenle, finansal verilerle çalışırken temel istatistik ve
hesaplamaları iyi anlamak ve kullanmak önemlidir.
R’da Temel İstatistik
Fonksiyonları
mean(x, na.rm = FALSE): x vektörünün aritmetik
ortalamasını hesaplar. na.rm = TRUE parametresi, eksik
değerleri (NA) göz ardı eder.
median(x, na.rm = FALSE): x vektörünün medyanını
hesaplar. na.rm = TRUE parametresi, eksik değerleri (NA)
göz ardı eder.
var(x, na.rm = FALSE): x vektörünün varyansını
hesaplar. na.rm = TRUE parametresi, eksik değerleri (NA)
göz ardı eder.
sd(x, na.rm = FALSE): x vektörünün standart sapmasını
hesaplar. na.rm = TRUE parametresi, eksik değerleri (NA)
göz ardı eder.
summary(x): x vektörünün temel istatistiksel özetini
verir (minimum, 1. çeyrek, medyan, ortalama, 3. çeyrek, maksimum).
cor(x, y, use = "pairwise.complete.obs"): x ve y
vektörleri arasındaki Pearson korelasyon katsayısını hesaplar.
use parametresi, eksik değerlerin nasıl ele alınacağını
belirler.
quantile(x, probs = seq(0, 1, 0.25), na.rm = FALSE): x
vektörünün belirli yüzdelik dilimlerini hesaplar. probs
parametresi, istenen yüzdelik dilimleri belirtir.
na.rm = TRUE parametresi, eksik değerleri (NA) göz ardı
eder.
range(x, na.rm = FALSE): x vektörünün minimum ve
maksimum değerlerini döndürür. na.rm = TRUE parametresi,
eksik değerleri (NA) göz ardı eder.
IQR(x, na.rm = FALSE): x vektörünün interquartile range
(IQR) değerini hesaplar. na.rm = TRUE parametresi, eksik
değerleri (NA) göz ardı eder.
table(x): x vektöründeki benzersiz değerlerin frekans
tablosunu oluşturur.
fivenum(x, na.rm = FALSE): x vektörünün beş sayısal
özetini (minimum, 1. çeyrek, medyan, 3. çeyrek, maksimum) döndürür.
na.rm = TRUE parametresi, eksik değerleri (NA) göz ardı
eder. # Örnek Veri Seti Oluşturma
# Örnek finansal veri seti oluşturma
set.seed(123) # Sonuçların tekrarlanabilir olması için
finansal_veri <- data.frame(
Tarih = seq(as.Date("2020-01-01"), by = "month", length.out = 12),
Getiri = rnorm(12, mean = 0.05, sd = 0.02), # Ortalama %5, standart sapma %2
Hacim = rnorm(12, mean = 1000, sd = 200) # Ortalama 1000, standart sapma 200
)
head(finansal_veri)
## Tarih Getiri Hacim
## 1 2020-01-01 0.03879049 1080.1543
## 2 2020-02-01 0.04539645 1022.1365
## 3 2020-03-01 0.08117417 888.8318
## 4 2020-04-01 0.05141017 1357.3826
## 5 2020-05-01 0.05258575 1099.5701
## 6 2020-06-01 0.08430130 606.6766
Temel İstatistik
Hesaplamaları
# Ortalama Getiri
ortalama_getiri <- mean(finansal_veri$Getiri, na.rm = TRUE)
ortalama_getiri # Ortalama getiriyi yazdır
## [1] 0.05388359
# Medyan Getiri
medyan_getiri <- median(finansal_veri$Getiri, na.rm = TRUE)
medyan_getiri # Medyan getiriyi yazdır
## [1] 0.05199796
# Getiri Varyansı
varyans_getiri <- var(finansal_veri$Getiri, na.rm = TRUE)
varyans_getiri # Varyansı yazdır
## [1] 0.0003424873
# Getiri Standart Sapması
std_sapma_getiri <- sd(finansal_veri$Getiri, na.rm = TRUE)
std_sapma_getiri # Standart sapmayı yazdır
## [1] 0.01850641
# Getiri Özeti
ozet_getiri <- summary(finansal_veri$Getiri)
ozet_getiri # Getiri özetini yazdır
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.02470 0.04051 0.05200 0.05388 0.06303 0.08430
# Hacim Özeti
ozet_hacim <- summary(finansal_veri$Hacim)
ozet_hacim # Hacim özetini yazdır
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 606.7 839.4 930.9 957.7 1085.0 1357.4
# Getiri ve Hacim Korelasyonu
korelasyon <- cor(finansal_veri$Getiri, finansal_veri$Hacim, use = "pairwise.complete.obs")
korelasyon # Korelasyonu yazdır
## [1] -0.3551815
Yüzdelik Dilimler ve
Aralık Hesaplamaları
# Getiri Yüzdelik Dilimleri
yuzdelik_getiri <- quantile(finansal_veri$Getiri, probs = seq(0, 1, 0.25), na.rm = TRUE)
yuzdelik_getiri # Yüzdelik dilimleri yazdır
## 0% 25% 50% 75% 100%
## 0.02469878 0.04051269 0.05199796 0.06303415 0.08430130
# Getiri Aralığı
aralik_getiri <- range(finansal_veri$Getiri, na.rm = TRUE)
aralik_getiri # Aralığı yazdır
## [1] 0.02469878 0.08430130
# Getiri IQR
iqr_getiri <- IQR(finansal_veri$Getiri, na.rm = TRUE)
iqr_getiri # IQR'yi yazdır
## [1] 0.02252146
# Getiri Frekans Tablosu
frekans_getiri <- table(cut(finansal_veri$Getiri, breaks = 5))
frekans_getiri # Frekans tablosunu yazdır
##
## (0.0246,0.0366] (0.0366,0.0485] (0.0485,0.0605] (0.0605,0.0724] (0.0724,0.0844]
## 2 3 4 0 3
# Getiri Beş Sayısal Özeti
bes_sayisal_getiri <- fivenum(finansal_veri$Getiri, na.rm = TRUE)
bes_sayisal_getiri # Beş sayısal özeti yazdır
## [1] 0.02469878 0.03993862 0.05199796 0.06684998 0.08430130
Sonuçların Özeti
- Bu analizde, finansal veri setimizdeki getirilerin temel
istatistiklerini hesapladık.
- Ortalama getiri %5, medyan getiri ise yaklaşık %5.
- Getiri varyansı ve standart sapması, getirilerin ne kadar değişken
olduğunu gösteriyor.
- Getiri ve hacim arasındaki korelasyon, bu iki değişkenin nasıl
ilişkili olduğunu anlamamıza yardımcı oldu.
- Yüzdelik dilimler, aralık ve IQR gibi ek istatistikler, getirilerin
dağılımını daha ayrıntılı incelememizi sağladı.
- Bu temel istatistikler, finansal verilerin analizinde önemli bir rol
oynar ve risk yönetimi, portföy optimizasyonu gibi alanlarda kritik
öneme sahiptir.
- R, bu tür istatistiksel analizler için güçlü ve esnek bir
araçtır.
- Finansal verilerle çalışırken, bu temel istatistik ve hesaplamaları
iyi anlamak ve kullanmak önemlidir.