24.09.2024 tarihli R ile veri analizi dersinde öğrendiğim konuları kısaca beş başlık altında toplayabilirim. Bunlar;

  1. Dilin Temelleri
  2. R ve R Studio kurulumu, güncellemeleri ve çalışma alanları
  3. Bunların avantajları, dezavantajları ve farklı kullanım alanları
  4. Hazır paket programların yüklenmesi
  5. Temel dört işlem, atama operatörü ve nesneler oluşturma

1. R ve R Studio’nun Temelleri

İlk olarak, R dilinin istatistiksel hesaplama ve veri analizi alanında ne kadar güçlü bir dil olduğunun farkına vardım. R’nin hem ücretsiz olması hem de açık kaynaklı bir yapıya sahip olması, onu özellikle ülkemizde tercih edilebilir bir programlama dili haline getiriyor. 1960 yılında geliştirilen S, dilinden türeyen R, 1996’da Ross Ihaka ve Robert Gentleman tarafından Auckland Üniversitesi’nde geliştirilmiş. Bu dilin gelişimi, 2000 yılında ilk sürümün yayınlanmasıyla hız kazanmış ve günümüzde oldukça geniş bir topluluğa hitap eder hale gelmiştir.

R programını ve özellikle RStudio’yu kullanmanın verimliliği artırdığına dair birçok bilgi edindim. RStudio’nun kullanıcı dostu bir arayüze sahip olması ve hata ayıklama, görselleştirme araçları sunması bu programı kullanmayı daha cazip kılıyor. Özellikle kod düzenleyicisi R’ı verimli bir şekilde kullanmayı sağlıyor.

2. R ve R Studio Kurulumu, Güncellemeleri ve Çalışma Alanları

R ve R Studio’nun kurulumu, veri analizi ve istatistiksel hesaplamalar için güçlü araçlar sunmaktadır. R’nin açık kaynaklı ve ücretsiz olması, akademik ve ticari kullanıcılar için büyük avantaj sağlamaktadır. R Studio ise R ile çalışmayı oldukça kolaylaştırmaktadır. Programlama deneyimi olmayan ben bile, R Studio’nun kullanıcı dostu arayüzü sayesinde R’nin güçlü özelliklerine hızlıca erişebileceğimi düşünüyorum. Ayrıca, güncellemelerin hem R hem de R Studio için ayrı yapılması gerektiğini, çalışma alanlarının her oturumda temizlenmesinin, eski nesnelerin karışıklık yaratmasını önlemek açısından önemli olduğunu öğrendim.

R ve R studio’nun kurulumu için R resmi sitesi ve R Studio resmi sitesini kullanmanın güvenlik açısından önemine değindik. Windows tabanlı işletin sistemi kullandığım için de ayrıca Rtools yüklemem gerektiğini öğrendim. R Studio’da panellerin yeri, rengi vb. özelliklerini değiştirerek kendime uygun çalışma alanı oluşturabileceğimi fark ettim. R Studio cheatsheets ve Oscar Torres* Reyna tutorial dokümanların bu programları kullanırken bana yardımcı olabilecek kaynaklar olduğunu öğrendim.

R’nin yeni sürümlerinin düzenli olarak yayınlandığını, yazılımı güncel tutmanın oldukça önemli olduğunu ve güncellemek için installr paketini kullanabileceğimi öğrendim.

installr paketini yüklemek için aşağıdaki kodu kullanabilirim.

# installr paketini yüklemek için aşağıdaki kodu kullanabilirsiniz
install.packages("installr")

# installr paketini yükledikten sonra, R'yi güncellemek için aşağıdaki kodları kullanabilirsiniz
library(installr)
updateR()

3. R ve R Studio’nun avantajları, dezavantajları ve kullanım alanları

R’nin açık kaynaklı yapısının getirdiği avantajların yanı sıra, özelleştirilebilir paketler ve simülasyon çalışmaları için sağladığı avantajları oldukça dikkat çekici buldum. Verileri analiz ederken kullanılabilecek birçok fonksiyon sunması ve bu analizlerin tekrarlanabilir olması, R’ı diğer programlardan ayırıyor. Özellikle diğer yazılımlarda manuel olarak yapılması gereken işlemlerin R’da birkaç satır kod ile yapılabilmesi, bu programın benim için en büyük avantajıdır. R’ın komut satırı arayüzünün, esneklik ve tekrar kullanılabilirlik sunması, aynı zamanda SPSS ve SAS gibi ticari yazılımlara kıyasla ücretsiz olması da büyük bir avantaj sağlar. Ayrıca Java gibi diğer dillerle entegre çalışabilmesi ile kullanıcı dostu hale getirilebilmesi, R’ın güçlü yönlerinden biridirdir. Öte yandan, R’da uzmanlaşmak zaman alıcı olacak gibi gözüküyor. Sanırım benim gibi kod yazma deneyimi olmayanlar için ise iki kat daha zorlayıcı. R, gerçekten planlama ve dikkat gerektiriyor, çünkü hataya çok açık açık bir dil ve kodlarını yazmak bazen çok zor. Hız açısından Python ve Matlab gibi dillere göre daha yavaş olduğunu öğrendim. Ancak bu durum şimdilik benim için bir dezavantaj değil. Dezavantaj olabilecek en önemli konu çok sayıda paket arasından en uygun olanı seçmek olabilir. Ancak bu dezavantajlar bile, istatistiksel işlemleri daha iyi anlamama yardımcı olacaktır diye düşünüyorum.

4. Hazır paket programların yüklenmesi

R paketleri, belirli bir problemin çözümü için başkaları tarafından geliştirilmiş ve kullanıma sunulmuş fonksiyon ve yardım dosyalarından oluşur. Bu paketler, R ile çeşitli istatistiksel analizler, grafiksel gösterimler ve veri manipülasyonları yapmamızı sağlar. R’da bir paketi yüklemek ve kullanmak için install.packages() fonksiyonunun kullanıldığını öğrendim. Örneğin aşağıdaki örnekte ggplot2 isimli paketin nasıl yükleyip etkinleştireceğimizi özetledim.

# ggplot2 paketini yükleme
install.packages("ggplot2")

# ggplot2 paketini etkinleştirme
library(ggplot2)

5. Temel dört işlem, atama operatörü ve nesneler oluşturma

R ile çalışmaya başladığımda, basit işlemlerin ve atama operatörü kullanımının ne kadar temel, fakat bir o kadar da önemli olduğunu fark ettim. R’ın, bir hesap makinesi gibi çalıştırılabilen basit bir aritmetik ortamı sunarken, aynı zamanda daha karmaşık veri manipülasyonları için güçlü araçlar sağladığını fark ettim.

Basit İşlemler

R’de toplama, çıkarma, çarpma gibi temel matematiksel işlemler arasında boşluk bırakmanın veya satır atlamanın sonuçları etkilemediğini gördüm. Bunu R dilin esnekliği olarak değerlendiriyorum. Örneğin, aşağıdaki işlemlerin aynı sonucu verdiğini deneyerek gördüm.

2 + 2
## [1] 4
2  +       2
## [1] 4
2 +
  2
## [1] 4

Atama Operatörü

Atama operatörü kullanımı ise R’de veri oluşturmanın ve manipüle etmenin temelini oluşturduğunu öğrendim. Genellikle <- operatörü kullanılır, ancak eşittir (=) operatörü de tercih edilebilir. Yine de, programlama yaparken = operatörünün matematiksel anlamıyla karışabileceğini öğrendim, bu yüzden <- kullanmak daha güvenlidir.

Nesne isimlendirmesi de önemlidir. R, büyük ve küçük harfler arasında duyarlıdır ve özel anlamları olan harfler (örn: T, F, c) ile isimlendirme yapmamaya dikkat etmem gerektiğini fark ettim.

Atama Örneği

a <- 10
b <- 5
toplam <- a + b

Nesneler ve Hesaplamalar

Nesnelerin yaratılmasının ve birbirleriyle etkileşime geçmesinin, R’ın güçlü özelliklerinden biri olduğunu öğrendim. Bunu yaparken aşağıdaki kodları kullandım.

ad <- "ada"
yas <- 16 + 20 
gun <- Sys.Date()
yeniyil <- as.Date("2024-01-01")
veri <- rnorm(n = 10, mean = 15, sd = 3)

# Hesaplamalar
yas + 10
## [1] 46
yeniyil - gun
## Time difference of -297 days
mean(veri)
## [1] 17.5257
Son olarak, geometrik işlemler üzerinde çalışırken dikdörtgenin alanını ve köşegen uzunluğunu hesaplamak gibi alıştırmalarla, matematiksel işlemlerin R’de nasıl kolayca yapılabileceğini keşfettim.
en <- 4
boy <- 10
alan <- en * boy
alan
## [1] 40

Sonuç olarak derste pratik uygulamalar, sadece kod yazmayı değil, aynı zamanda R ile farklı alanlardaki problemleri çözebileceğimi ve analizler yapabileceğimi fark ettirdi. R’nin esnekliği ve geniş işlevselliğinin, basit işlemlerden kompleks veri analizlerine kadar birçok farklı ihtiyacıma çözüm sunabileceğini düşünüyorum.

HAFTANIN ÖDEVLERİ

#SORU-1 VE 2
#a)
8+12 #TOPLAMA
## [1] 20
#b)
8**2 #KARE ALMA
## [1] 64
#c)
(5+5)/2 #BOLME
## [1] 5
#d)
sqrt(36) # KAREKOK ALMA
## [1] 6
#SORU-3 (a,b,c,d,e,f)
a<-5
alana<-3.14*a**2
alana
## [1] 78.5
b<-10
alanb<-3.14*b**2
alanb
## [1] 314
c<-15
alanc<-3.14*c**2
alanc
## [1] 706.5
alana<alanb
## [1] TRUE
alana<alanc
## [1] TRUE
alanb>alanc
## [1] FALSE
alanc<alana
## [1] FALSE
alanc>alanb
## [1] TRUE
ls()
##  [1] "a"       "ad"      "alan"    "alana"   "alanb"   "alanc"   "b"      
##  [8] "boy"     "c"       "en"      "gun"     "toplam"  "veri"    "yas"    
## [15] "yeniyil"
#rm()

#SORU-4
x<-56
u<-40
#a)
s1<-4
zpuan1<-(x-u)/s1
zpuan1
## [1] 4
#b)
s2<-8
zpuan2<-(x-u)/s2
zpuan2
## [1] 2
#c)
s3<-16
zpuan3<-(x-u)/s3
zpuan3
## [1] 1
#d)
s4<-32
zpuan4<-(x-u)/s4
zpuan4
## [1] 0.5

DİĞER SORULAR 2. HAFTA TAMAMLANACAKTIR