EKONOMETRI ILK PROJE

ilk poroje

Ryükleme

Rmarkdown başlangıç

Web sayfasını hazırlama

Internete yükleme

Ortalama, standart sapma, kovaryans ve korelasyon nedir?

ortalama nedir

“Ortalama”, bir veri kümesindeki sayıların genel bir temsilini ifade eden bir terimdir. Bir veri kümesindeki sayıların toplamının sayı adedine bölünmesiyle bulunur.

Ortalama, veri setinin genel eğilimini anlamak için kullanışlı bir ölçüdür. Örneğin, bir sınıftaki öğrencilerin notlarının ortalama alınması, sınıfın genel performansını anlamak için kullanılabilir.

ortalama formülü

\[ \bar{X} = \frac {\Sigma^n_İ (X_i)}{n} \]

Standart sapma nedir

Standart sapma, bir veri kümesindeki değerlerin ortalamadan ne kadar uzaklaştığını ölçen bir istatistiksel ölçüdür. Yani, bir veri setinin ne kadar homojen veya heterojen olduğunu belirlemeye yardımcı olur. Bir veri setindeki her bir değerin ortalamadan ne kadar farklı olduğunu bulmak için standart sapma hesaplanır.

Standart sapma formülü

\[ \sigma = \sqrt \frac {\Sigma^N_i (X_i-\bar{X})^2}{N} \]

kovaryans nedir?

Kovaryans, iki değişken arasındaki ilişkinin değişkenliklerini ölçen bir istatistiksel terimdir. Özellikle, bu iki değişkenin birlikte nasıl değiştiğini ölçmek için kullanılır. Kovaryans, bu değişkenlerin birlikte artıp azaldığı durumları ve bunların ne kadar birbirine bağlı olduğunu belirlemeye yardımcı olur.

kovaryans formülü

\[ cov(X,Y)=\frac {\Sigma^n_i (X_i-X)(Y_i-Y)}{n-1} \]

korelasyon nedir ?

korelasyon bir istatistik terimi olup, iki değişken arasındaki ilişkiyi ölçen bir ölçüdür. Bu ilişki, değişkenlerin birlikte nasıl değiştiğini ve birbirlerine ne kadar bağımlı olduklarını belirler. Daha basit bir tanımla, korelasyon, iki değişken arasındaki ilişkinin doğasını ve yönünü belirler. İki değişken arasında pozitif bir korelasyon varsa, bir değişken arttığında diğerinin de arttığı görülür. Negatif bir korelasyon ise bir değişken arttığında diğerinin azaldığını gösterir

korelasyon formülü

\[ R = \frac {\Sigma (x_i-\bar{x})(y_i-\bar{y})}{ \sqrt {\Sigma (x_i-\bar{x})^2 \Sigma (y_i-\bar{y})}} \]

library(WDI)
## Warning: package 'WDI' was built under R version 4.3.3
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
# Örnek enflasyon verilerini oluşturalım
years <- c(2015, 2016, 2017, 2018, 2019, 2020, 2021)
ukraine_inflation <- c(48.7, 12.4, 13.9, 9.8, 4.1, 5.2, 7.3)
somalia_inflation <- c(3.2, 4.5, 5.8, 7.1, 8.4, 9.7, 11.0)

# Verileri bir veri çerçevesine dönüştürelim
inflation_data <- data.frame(Year = years,
                             Ukraine = ukraine_inflation,
                             Somalia = somalia_inflation)

# Grafik çizimi
library(ggplot2)

ggplot(inflation_data, aes(x = Year)) +
  geom_line(aes(y = Ukraine, color = "Ukraine")) +
  geom_line(aes(y = Somalia, color = "Somalia")) +
  labs(title = "Ukraine vs Somalia Enflasyon",
       x = "Yıl",
       y = "Enflasyon Oranı (%)",
       color = "Ülke") +
  scale_color_manual(values = c("Ukraine" = "blue", "Somalia" = "red")) +
  theme_minimal()

Makine Öğrenmesi Açıklayın?

Makine öğrenmesi, bilgisayarların verileri analiz etmesi ve desenleri belirlemesi için kullanılan bir yapay zeka dalıdır. Bu desenler, daha sonra tahminler yapmak, kararlar vermek veya görevleri gerçekleştirmek için kullanılabilir. Makine öğrenimi, belirli bir talimat dizisi yerine veri üzerinde deneyimlerden öğrenme prensibine dayanır.

Makine öğrenimi, genellikle üç ana kategoride incelenir:

Gözetimli Öğrenme (Supervised Learning): Bu tür öğrenme, bir girdi ve bu girdiye karşılık gelen bir çıktı arasındaki ilişkiyi modellemeye odaklanır. Algoritma, önceden etiketlenmiş (etiketlenmiş) veri kümesini kullanarak bu ilişkiyi öğrenir. Örneğin, bir evin özelliklerini (odaların sayısı, konumu, vb.) girdi olarak alıp fiyatını çıktı olarak tahmin etmeyi öğrenen bir model.

Denetimsiz Öğrenme (Unsupervised Learning): Bu tür öğrenmede, verilerdeki desenleri veya yapıları bulmak için algoritmalardan faydalanılır. Bu durumda veri etiketlenmemiş ve algoritma, veri arasındaki doğal grupları veya ilişkileri tanımlamak için kullanılır. Örneğin, benzer özelliklere sahip veri noktalarını bir araya getirerek pazar segmentlerini belirleyen bir kümeleme algoritması.

Pekiştirmeli Öğrenme (Reinforcement Learning): Bu tür öğrenmede, bir sistem, bir ortamla etkileşime girer ve bu ortamda belirli bir hedefi en iyi şekilde elde etmek için deneyerek öğrenir. Sistem, çevreden aldığı geri bildirimlere (ödüller veya cezalar) dayanarak eylemlerini optimize etmeye çalışır. Örneğin, bir robotun belirli bir oyunu oynamayı öğrenmesi veya bir otonom aracın trafikte güvenli bir şekilde sürmesini öğrenmesi gibi.

Makine öğrenimi, büyük miktarda veriyi işleyebilen ve bu verilerdeki desenleri algılayabilen algoritmalar geliştirme konusunda büyük bir potansiyele sahiptir. Bu algoritmalar, birçok endüstride kullanılır, örneğin sağlık, finans, ulaşım, e-ticaret ve daha birçok alanda. Ancak, makine öğrenimi algoritmaları, doğru sonuçlar üretebilmek için doğru veriye ve uygun bir modelleme yaklaşımına ihtiyaç duyar. Ayrıca, algoritmaların eğitimi, model seçimi ve sonuçların yorumlanması gibi bazı zorlukları da içerir.

Kaggle projesi