EKONOMETRI PROJE: ADAM IBRAHIM HAROUN (2010701531)
EKONOMETRI PROJE: İstatistik Kavramları
1. Betimsel İstatistik
Betimsel istatistikler, bir çalışmadaki verilerin temel özelliklerini açıklamak için kullanılır.
Ortalama
Bir sayı kümesinin ortalaması veya ortalama değeri, tüm değerleri toplamak ve değer sayısına bölmek suretiyle hesaplanır. Örneğin, aşağıdaki sınav notlarını ele alalım: 70, 80, 85, 90 ve 95.
\[ \bar{x} = \frac{70 + 80 + 85 + 90 + 95}{5} = \frac{420}{5} = 84 \]
Bu durumda, ortalama not 84’tür.
Standart Sapma
Standart sapma, bir değer kümesindeki değişim veya yayılmanın miktarını ölçer. Değerlerin ortalama değerden ne kadar uzak olduğunu gösterir.
\[ \sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2} \]
Sınav notları örneğimize devam edelim. Standart sapma, notların ortalama olan 84’ten ne kadar sapıldığını anlamamıza yardımcı olabilir.
Örnek
İki farklı sınıf için sınav notlarının şu şekilde olduğunu varsayalım:
- Sınıf A: 70, 80, 85, 90, 95
- Sınıf B: 60, 75, 80, 85, 100
Her iki sınıf için de ortalama 84’tür, ancak Sınıf A, Sınıf B’ye göre daha az değişkenliktedir. Bu farkı ölçmek için her iki not kümesi için standart sapmayı hesaplayabiliriz.
2. Çıkarımsal İstatistik
Çıkarımsal istatistikler, bir veri örneğine dayanarak bir popülasyon hakkında çıkarımlar veya tahminler yapmak için kullanılır.
Örnekleme
Çıkarımsal istatistiklerde, genellikle tüm popülasyon yerine bir veri örneğiyle çalışırız. Örnek, popülasyonun bir alt kümesidir ve popülasyon hakkında sonuçlar çıkarmak için toplar ve analiz ederiz.
Popülasyon ve Örnek Parametreleri
- Popülasyon: Bilgi alınmak istenen tüm bireylerin veya öğelerin tam grubu.
- Örnek: Çalışma için seçilen popülasyonun bir alt kümesi.
- Popülasyon Parametresi: Popülasyonun bir özelliğini tanımlayan sayısal bir ölçü. Örneğin, popülasyonun ortalaması, popülasyonun standart sapması vb.
- Örnek İstatistiği: Bir örneğin bir özelliğini tanımlayan sayısal bir ölçü. Örneğin, örnek ortalaması, örnek standart sapması vb.
Güven Aralığı
Güven aralığı, gerçek popülasyon parametresini içerebilecek muhtemel değerler aralığıdır. Parametre için olası değerlerin bir aralığını sağlar.
# Generate some sample data
set.seed(123)
sample_data <- rnorm(n = 100, mean = 10, sd = 2)
# Calculate sample mean and standard deviation
sample_mean <- mean(sample_data)
sample_sd <- sd(sample_data)
# Calculate z-score for 95% confidence interval
z_score <- qnorm(0.975)
# Calculate confidence interval bounds
lower_bound <- sample_mean - z_score * (sample_sd / sqrt(length(sample_data)))
upper_bound <- sample_mean + z_score * (sample_sd / sqrt(length(sample_data)))
# Plot the data and confidence interval
plot(sample_data, main = "Güven Aralığı", xlab = "Örnek", ylab = "Değer", col = "blue", pch = 19)
abline(h = sample_mean, col = "red", lty = 2, lwd = 2)
segments(x0 = 1, x1 = 1, y0 = lower_bound, y1 = upper_bound, col = "green", lwd = 2)Sonuç
Betimsel ve çıkarımsal istatistikler, verileri analiz etme ve yorumlama konusunda hayati roller oynar.
Betimsel istatistikler, verilerin merkezi eğilim ve değişkenlik gibi temel özelliklerini özetlememize ve anlamamıza yardımcı olur. Veri setinin özelliklerini anlamamızı sağlayarak desenleri, trendleri ve ilişkileri belirleyebilirler.
Çıkarımsal istatistikler ise bir veri örneğine dayanarak bir popülasyon hakkında çıkarımlar veya tahminler yapmamızı sağlar. Bize sonuçlar çıkarmamıza, hipotezleri test etmemize ve çeşitli alanlarda, bilimden iş dünyasına, sağlık hizmetlerinden sosyal bilimlere kadar güvenilir sonuçlar çıkarmamıza yardımcı olurlar.
Bu istatistik kavramlarını anlamak, verileri etkili bir şekilde analiz etmek, bilgi sahibi kararlar almak ve çeşitli alanlarda, bilimden iş dünyasına, sağlık hizmetlerinden sosyal bilimlere kadar güvenilir sonuçlar çıkarmak için temel öneme sahiptir.