1 Temel İstatistik ve Hesaplamalar

  • Temel istatistik ve hesaplamalar, finansal verilerin analizinde önemli bir rol oynar.
  • Ortalama, medyan, varyans, standart sapma gibi temel istatistikler, verilerin merkezi eğilimini ve dağılımını anlamamıza yardımcı olur.
  • Finansal verilerde, getiriler, volatilite ve korelasyon gibi kavramlar da temel istatistik ve hesaplamalarla ifade edilir.
  • R, bu tür istatistiksel analizler için geniş bir fonksiyon yelpazesi sunar.
  • Örneğin, mean(), median(), var(), sd() gibi fonksiyonlar, temel istatistikleri hesaplamak için kullanılır.
  • Ayrıca, cor() fonksiyonu ile değişkenler arasındaki korelasyonu hesaplayabiliriz.
  • Finansal verilerin analizinde, bu temel istatistik ve hesaplamalar, risk yönetimi, portföy optimizasyonu ve performans değerlendirmesi gibi alanlarda kritik öneme sahiptir.
  • Bu nedenle, finansal verilerle çalışırken temel istatistik ve hesaplamaları iyi anlamak ve kullanmak önemlidir.

2 R’da Temel İstatistik Fonksiyonları

  • mean(x, na.rm = FALSE): x vektörünün aritmetik ortalamasını hesaplar. na.rm = TRUE parametresi, eksik değerleri (NA) göz ardı eder.
  • median(x, na.rm = FALSE): x vektörünün medyanını hesaplar. na.rm = TRUE parametresi, eksik değerleri (NA) göz ardı eder.
  • var(x, na.rm = FALSE): x vektörünün varyansını hesaplar. na.rm = TRUE parametresi, eksik değerleri (NA) göz ardı eder.
  • sd(x, na.rm = FALSE): x vektörünün standart sapmasını hesaplar. na.rm = TRUE parametresi, eksik değerleri (NA) göz ardı eder.
  • summary(x): x vektörünün temel istatistiksel özetini verir (minimum, 1. çeyrek, medyan, ortalama, 3. çeyrek, maksimum).
  • cor(x, y, use = "pairwise.complete.obs"): x ve y vektörleri arasındaki Pearson korelasyon katsayısını hesaplar. use parametresi, eksik değerlerin nasıl ele alınacağını belirler.
  • quantile(x, probs = seq(0, 1, 0.25), na.rm = FALSE): x vektörünün belirli yüzdelik dilimlerini hesaplar. probs parametresi, istenen yüzdelik dilimleri belirtir. na.rm = TRUE parametresi, eksik değerleri (NA) göz ardı eder.
  • range(x, na.rm = FALSE): x vektörünün minimum ve maksimum değerlerini döndürür. na.rm = TRUE parametresi, eksik değerleri (NA) göz ardı eder.
  • IQR(x, na.rm = FALSE): x vektörünün interquartile range (IQR) değerini hesaplar. na.rm = TRUE parametresi, eksik değerleri (NA) göz ardı eder.
  • table(x): x vektöründeki benzersiz değerlerin frekans tablosunu oluşturur.
  • fivenum(x, na.rm = FALSE): x vektörünün beş sayısal özetini (minimum, 1. çeyrek, medyan, 3. çeyrek, maksimum) döndürür. na.rm = TRUE parametresi, eksik değerleri (NA) göz ardı eder. # Örnek Veri Seti Oluşturma
# Örnek finansal veri seti oluşturma
set.seed(123)  # Sonuçların tekrarlanabilir olması için
finansal_veri <- data.frame(
  Tarih = seq(as.Date("2020-01-01"), by = "month", length.out = 12),
  Getiri = rnorm(12, mean = 0.05, sd = 0.02),  # Ortalama %5, standart sapma %2
  Hacim = rnorm(12, mean = 1000, sd = 200)  # Ortalama 1000, standart sapma 200
)
head(finansal_veri)
##        Tarih     Getiri     Hacim
## 1 2020-01-01 0.03879049 1080.1543
## 2 2020-02-01 0.04539645 1022.1365
## 3 2020-03-01 0.08117417  888.8318
## 4 2020-04-01 0.05141017 1357.3826
## 5 2020-05-01 0.05258575 1099.5701
## 6 2020-06-01 0.08430130  606.6766

3 Temel İstatistik Hesaplamaları

# Ortalama Getiri
ortalama_getiri <- mean(finansal_veri$Getiri, na.rm = TRUE)
ortalama_getiri # Ortalama getiriyi yazdır    
## [1] 0.05388359
# Medyan Getiri
medyan_getiri <- median(finansal_veri$Getiri, na.rm = TRUE)
medyan_getiri # Medyan getiriyi yazdır
## [1] 0.05199796
# Getiri Varyansı
varyans_getiri <- var(finansal_veri$Getiri, na.rm = TRUE)
varyans_getiri # Varyansı yazdır
## [1] 0.0003424873
# Getiri Standart Sapması
std_sapma_getiri <- sd(finansal_veri$Getiri, na.rm = TRUE)
std_sapma_getiri # Standart sapmayı yazdır
## [1] 0.01850641
# Getiri Özeti
ozet_getiri <- summary(finansal_veri$Getiri)
ozet_getiri # Getiri özetini yazdır
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 0.02470 0.04051 0.05200 0.05388 0.06303 0.08430
# Hacim Özeti
ozet_hacim <- summary(finansal_veri$Hacim)
ozet_hacim # Hacim özetini yazdır
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   606.7   839.4   930.9   957.7  1085.0  1357.4
# Getiri ve Hacim Korelasyonu
korelasyon <- cor(finansal_veri$Getiri, finansal_veri$Hacim, use = "pairwise.complete.obs")
korelasyon # Korelasyonu yazdır
## [1] -0.3551815

4 Yüzdelik Dilimler ve Aralık Hesaplamaları

# Getiri Yüzdelik Dilimleri
yuzdelik_getiri <- quantile(finansal_veri$Getiri, probs = seq(0, 1, 0.25), na.rm = TRUE)
yuzdelik_getiri # Yüzdelik dilimleri yazdır
##         0%        25%        50%        75%       100% 
## 0.02469878 0.04051269 0.05199796 0.06303415 0.08430130
# Getiri Aralığı
aralik_getiri <- range(finansal_veri$Getiri, na.rm = TRUE)
aralik_getiri # Aralığı yazdır
## [1] 0.02469878 0.08430130
# Getiri IQR
iqr_getiri <- IQR(finansal_veri$Getiri, na.rm = TRUE)
iqr_getiri # IQR'yi yazdır
## [1] 0.02252146
# Getiri Frekans Tablosu
frekans_getiri <- table(cut(finansal_veri$Getiri, breaks = 5))
frekans_getiri # Frekans tablosunu yazdır
## 
## (0.0246,0.0366] (0.0366,0.0485] (0.0485,0.0605] (0.0605,0.0724] (0.0724,0.0844] 
##               2               3               4               0               3
# Getiri Beş Sayısal Özeti
bes_sayisal_getiri <- fivenum(finansal_veri$Getiri, na.rm = TRUE)
bes_sayisal_getiri # Beş sayısal özeti yazdır
## [1] 0.02469878 0.03993862 0.05199796 0.06684998 0.08430130

5 Sonuçların Özeti

  • Bu analizde, finansal veri setimizdeki getirilerin temel istatistiklerini hesapladık.
  • Ortalama getiri %5, medyan getiri ise yaklaşık %5.
  • Getiri varyansı ve standart sapması, getirilerin ne kadar değişken olduğunu gösteriyor.
  • Getiri ve hacim arasındaki korelasyon, bu iki değişkenin nasıl ilişkili olduğunu anlamamıza yardımcı oldu.
  • Yüzdelik dilimler, aralık ve IQR gibi ek istatistikler, getirilerin dağılımını daha ayrıntılı incelememizi sağladı.
  • Bu temel istatistikler, finansal verilerin analizinde önemli bir rol oynar ve risk yönetimi, portföy optimizasyonu gibi alanlarda kritik öneme sahiptir.
  • R, bu tür istatistiksel analizler için güçlü ve esnek bir araçtır.
  • Finansal verilerle çalışırken, bu temel istatistik ve hesaplamaları iyi anlamak ve kullanmak önemlidir.