EKONOMETRI ILK PROJE
ilk poroje
Ryükleme
Rmarkdown başlangıç
Web sayfasını hazırlama
Internete yükleme
formula yazma
\[ \mathrm{Var}(X) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]
## Warning: package 'WDI' was built under R version 4.3.3
## Warning: package 'ggplot2' was built under R version 4.3.3
# Örnek enflasyon verilerini oluşturalım
years <- c(2015, 2016, 2017, 2018, 2019, 2020, 2021)
ukraine_inflation <- c(48.7, 12.4, 13.9, 9.8, 4.1, 5.2, 7.3)
somalia_inflation <- c(3.2, 4.5, 5.8, 7.1, 8.4, 9.7, 11.0)
# Verileri bir veri çerçevesine dönüştürelim
inflation_data <- data.frame(Year = years,
Ukraine = ukraine_inflation,
Somalia = somalia_inflation)
# Grafik çizimi
library(ggplot2)
ggplot(inflation_data, aes(x = Year)) +
geom_line(aes(y = Ukraine, color = "Ukraine")) +
geom_line(aes(y = Somalia, color = "Somalia")) +
labs(title = "Ukraine vs Somalia Enflasyon",
x = "Yıl",
y = "Enflasyon Oranı (%)",
color = "Ülke") +
scale_color_manual(values = c("Ukraine" = "blue", "Somalia" = "red")) +
theme_minimal()Makine Öğrenmesi Açıklayın?
Makine öğrenmesi, bilgisayarların verileri analiz etmesi ve desenleri belirlemesi için kullanılan bir yapay zeka dalıdır. Bu desenler, daha sonra tahminler yapmak, kararlar vermek veya görevleri gerçekleştirmek için kullanılabilir. Makine öğrenimi, belirli bir talimat dizisi yerine veri üzerinde deneyimlerden öğrenme prensibine dayanır.
Makine öğrenimi, genellikle üç ana kategoride incelenir:
Gözetimli Öğrenme (Supervised Learning): Bu tür öğrenme, bir girdi ve bu girdiye karşılık gelen bir çıktı arasındaki ilişkiyi modellemeye odaklanır. Algoritma, önceden etiketlenmiş (etiketlenmiş) veri kümesini kullanarak bu ilişkiyi öğrenir. Örneğin, bir evin özelliklerini (odaların sayısı, konumu, vb.) girdi olarak alıp fiyatını çıktı olarak tahmin etmeyi öğrenen bir model.
Denetimsiz Öğrenme (Unsupervised Learning): Bu tür öğrenmede, verilerdeki desenleri veya yapıları bulmak için algoritmalardan faydalanılır. Bu durumda veri etiketlenmemiş ve algoritma, veri arasındaki doğal grupları veya ilişkileri tanımlamak için kullanılır. Örneğin, benzer özelliklere sahip veri noktalarını bir araya getirerek pazar segmentlerini belirleyen bir kümeleme algoritması.
Pekiştirmeli Öğrenme (Reinforcement Learning): Bu tür öğrenmede, bir sistem, bir ortamla etkileşime girer ve bu ortamda belirli bir hedefi en iyi şekilde elde etmek için deneyerek öğrenir. Sistem, çevreden aldığı geri bildirimlere (ödüller veya cezalar) dayanarak eylemlerini optimize etmeye çalışır. Örneğin, bir robotun belirli bir oyunu oynamayı öğrenmesi veya bir otonom aracın trafikte güvenli bir şekilde sürmesini öğrenmesi gibi.
Makine öğrenimi, büyük miktarda veriyi işleyebilen ve bu verilerdeki desenleri algılayabilen algoritmalar geliştirme konusunda büyük bir potansiyele sahiptir. Bu algoritmalar, birçok endüstride kullanılır, örneğin sağlık, finans, ulaşım, e-ticaret ve daha birçok alanda. Ancak, makine öğrenimi algoritmaları, doğru sonuçlar üretebilmek için doğru veriye ve uygun bir modelleme yaklaşımına ihtiyaç duyar. Ayrıca, algoritmaların eğitimi, model seçimi ve sonuçların yorumlanması gibi bazı zorlukları da içerir.
Kaggle projesi

Spacehip Titanic (Kaggle Tanıtımı)
“2912 yılına hoş geldiniz, burada veri bilimi becerilerinizin bir kozmik gizemi çözmek için gerektiği bir zamandayız. Dört ışık yılı uzaklıktan bir ileti aldık ve durum iyi görünmüyor.
Uzay Gemisi Titanic, bir ay önce fırlatılan bir yıldızlararası yolcu gemisiydi. Yaklaşık 13.000 yolcuyla yola çıkan gemi, Güneş sistemimizden üç yeni yaşanabilir yıldız etrafında dönen gezegenlere göçmenleri taşıyarak ilk seferine başladı.
İlk varış noktası olan 55 Cancri E’ye, Alfa Centauri’yi dolaşırken, dikkatsiz Uzay Gemisi Titanic, bir toz bulutunun içinde gizlenmiş bir uzay-zaman anormalliğiyle çarpıştı. Ne yazık ki, adını taşıdığı gemiye bin yıl önceki kaderle benzer bir kaderi paylaştı. Gemi bütünlüğünü korudu, ancak neredeyse yolcuların yarısı alternatif bir boyuta taşındı!
Kurtarma ekiplerine yardım etmek ve kayıp yolcuları kurtarmak için, uzay gemisinin hasar görmüş bilgisayar sisteminden kurtarılan kayıtları kullanarak hangi yolcuların anormallik tarafından taşındığını tahmin etmeniz isteniyor.
Onları kurtarmaya yardım edin ve tarihi değiştirin!”
Ortalama, standart sapma, kovaryans ve korelasyon nedir?
\[ \bar{X} = \frac {\Sigma^n_İ (X_i)}{n} \] \[ R = \frac {\Sigma (x_i-\bar{x})(y_i-\bar{y})}{ \sqrt {\Sigma (x_i-\bar{x})^2 \Sigma (y_i-\bar{y})}} \] \[ \sigma = \sqrt \frac {\Sigma^N_i (X_i-\bar{X})^2}{N} \] \[ \bar{X} = \frac {\Sigma^n_İ (X_i)}{n} \] ## TRAIN VE TEST Nedir?
“Train” ve “test”, makine öğrenimi sürecinde veri setlerinin bölünmesi ve modelin eğitilmesi ile doğrulanması için kullanılan terimlerdir.
Eğitim Veri Seti (Train Data): Eğitim veri seti, makine öğrenimi modelinin öğrenme sürecinde kullanılan veri setidir. Bu veri seti, genellikle modelin girdi verileriyle birlikte doğru çıktıları içerir. Model, eğitim veri setindeki örnekler üzerinde eğitilir ve veri setindeki desenleri tanımlamak için optimize edilir.
Test Veri Seti (Test Data): Test veri seti, modelin eğitildikten sonra performansını değerlendirmek için kullanılan ayrı bir veri setidir. Model, test veri setindeki örnekler üzerinde uygulanır ve tahminler yapar. Bu tahminler, gerçek çıktılarla karşılaştırılır ve modelin ne kadar iyi performans gösterdiği değerlendirilir. Test veri seti, modelin eğitim veri setinden bağımsız bir şekilde değerlendirilmesini sağlar ve modelin gerçek dünya verileri üzerinde nasıl performans gösterebileceğini belirlemeye yardımcı olur.
Makine öğrenimi sürecinde, eğitim ve test veri setleri genellikle rastgele bölünür. Bu bölünme, genellikle eğitim için daha büyük bir oranda (%70-%80) ve test için daha küçük bir oranda (%20-%30) olacak şekilde yapılır. Ancak, veri setinin boyutuna, problemin karmaşıklığına ve diğer faktörlere bağlı olarak bu oranlar değişebilir. Veri setinin bölünmesi, modelin doğruluğunu değerlendirmek ve aşırı uydurma gibi problemleri tespit etmek için önemlidir.
## Warning: package 'readr' was built under R version 4.3.3