3: X-Y Koordinat Sistemi ve Serpilme (Dağılım) Diyagramı (Scatter Plot) Mantığı

İki sürekli değişken arasındaki ilişkiyi görselleştirmek ve matematiksel bir formüle (doğrusal denkleme) dökmek için koordinat sistemi kullanılır.

Korelasyon analizi, iki sayısal değişken arasındaki ilişkinin gücünü ve yönünü söyler ve aldığı değer 0 ile 1 veya 0 ile -1 arasında değişir. Excel’de Insert -> Scatter Plot (Serpilme Diyagramı) adımlarıyla bu ilişkiler görselleştirilir.

Excel Örnek Uygulamaları (5 Öğrenci Verisi):

Veri Setini Tanıyalım:

Bu bölümde, korelasyon ve regresyonun arkasındaki temel mantığı anlamak için tasarlanmış basit bir veri setini inceleyeceğiz. Veri setimiz, 5 farklı öğrenciye (St1, St2, St3, St4, St5) ait gözlemleri içermektedir.

Her bir öğrenci için ortak olan temel bir bilgi vardır: Haftada kaç saat ders çalıştıkları. Bu, bizim bağımsız değişkenimizdir. Ardından, bu çalışma saatlerinin dört farklı sonuç üzerindeki etkisini inceleyen dört ayrı senaryomuz bulunmaktadır:

  • Tarih Dersi Notu

  • Fizik Dersi Notu

  • İşletme Dersi Notu

  • Genel Stres Seviyesi

Buradaki tüm değişkenler (hem çalışma saati hem de sonuçlar) sayısal değişkenlerdir. Bu veri setinin amacı, istatistiksel varsayımları (örneğin normal dağılım) karşılamak değil, değişkenler arasındaki ilişkilerin temelini pratik bir şekilde kavramaktır.

İlk Senaryo: Saat ve Tarih Notu İlişkisi

Şimdi, ilk senaryoya, yani çalışma saati ile tarih dersinden alınan not arasındaki ilişkiye dikkatle bakalım:

  • 1 saat çalışan öğrencinin notu: 1

  • 2 saat çalışan öğrencinin notu: 2

  • 3 saat çalışan öğrencinin notu: 3

4 saat çalışan öğrencinin notu: 4

  • 5 saat çalışan öğrencinin notu: 5

Herhangi bir istatistiksel formül kullanmadan önce, zihnimiz bu iki değişken arasında hemen bir örüntü (pattern) fark eder. Bu örüntü sabit, beklenebilir, öngörülebilir ve tekrarlanabilir bir ilişkidir. Sezgisel olarak hemen anladığımız şey şudur: “Bir öğrenci ne kadar saat çalışırsa, tarih dersinden tam olarak o kadar not alıyor.”

Şimdi Excel'de bu örüntüyü görmek için yapmamız gereken adımları uygulayalım.

Not: Çıkan grafiğin ilgili eksenleri tıklayarak Home kısmından yazı karakterlerini büyütebilir renklendirebilirsiniz.

Karşımıza gelen grafiğe tıkladığımızda ise

Hocamızın yaptığı değişikliklerden sonra elde ettiği grafik aşağıdaki gibidir.

Bu Grafik ile Hocamızın Anlattıkları Aşağıdaki Gibidir.

Grafiksel Analiz: Serpilme Diyagramı (Scatter Plot) ve Korelasyon Kavramı

İki sayısal değişken arasındaki ilişkiyi anlamanın en etkili yollarından biri, veriyi görselleştirmektir. Bu amaçla kullanılan temel grafik Serpilme Diyagramı (Scatter Plot)’dır.

1. Verinin Görselleştirilmesi: Koordinat Sistemi

Karşımızdaki grafik, Saat (bağımsız değişken) ile Tarih notu (bağımlı değişken) arasındaki ilişkiyi göstermektedir. Bu görselleştirme, her bir gözlem biriminin (öğrencinin) iki eksendeki değerlerinin kesişim noktasına bir nokta koyularak oluşturulur:

X Ekseni (Yatay): Ders Çalışma Saati

Y Ekseni (Dikey): Tarih Notu

Grafiğin oluşturulma mantığı şöyledir:

1. Öğrenci (St1): 1 saat çalışmış (X=1) ve 1 notunu almıştır (Y=1). Bu iki değerin kesiştiği (1,1) koordinatına bir nokta konulur.

2. Öğrenci (St2): 2 saat çalışmış (X=2) ve 2 notunu almıştır (Y=2). Kesişim noktası olan (2,2) koordinatına bir nokta konulur.

Bu işlem tüm öğrenciler için (3,3), (4,4) ve (5,5) noktalarıyla tekrarlanır.

Bu işlem, tablodaki ham veriyi görsel bir örüntüye dönüştürür.

2. Görsel Yorumlama: İlişkinin Yönü ve Doğrusallık

Grafiğe ilk bakışta, herhangi bir hesaplama yapmadan dahi, gözümüz noktalar arasında net bir ilişki olduğunu algılar. Bu ilişkinin iki temel özelliği vardır:

  1. Pozitif Yönlü İlişki: Noktalar sol alttan sağ üste doğru bir yol izlemektedir. Bu durum, değişkenlerden biri artarken (ders çalışma saati), diğer değişkenin de (tarih notu) arttığı anlamına gelir.
  1. Doğrusal (Lineer) İlişki: Tüm noktalar, sanki bir cetvelle çizilmiş gibi mükemmel bir doğru üzerinde sıralanmıştır.

3. Korelasyon Kavramı: İlişkinin Yönünü ve Gücünü Ölçmek

Görsel olarak tespit ettiğimiz bu ilişkiyi sayısal olarak ifade etmemizi sağlayan istatistiksel ölçüme korelasyon denir. Korelasyon katsayısı (genellikle r ile gösterilir) bize iki temel bilgiyi verir:

Yön:

Pozitif Korelasyon: Değişkenler aynı yönde hareket eder (biri artarken diğeri de artar). Sonuç pozitif bir sayıdır.

Negatif Korelasyon: Değişkenler zıt yönde hareket eder (biri artarken diğeri azalır). Sonuç negatif bir sayıdır.

Güç:

Korelasyon katsayısı -1 ile +1 arasında bir değer alır.

Sıfıra yaklaştıkça ilişki zayıflar. (0, doğrusal bir ilişki olmadığını gösterir).

Korelasyon katsayısı -1 veya +1’e yaklaştıkça ilişki güçlenir.

4. Mükemmel Pozitif Korelasyon (r = +1.0)

İncelediğimiz bu örnekte, Saat değişkenindeki her bir birimlik artış, Tarih notunda istisnasız bir şekilde ve sabit bir oranda artışa neden olmaktadır. Bu örüntü hiç bozulmaz. Bu durum, iki değişken arasında olabilecek en güçlü pozitif ilişkiyi tanımlar ve korelasyon katsayısının değeri tam olarak +1.0’dır.

Eğer bu örüntüde küçük bir sapma olsaydı (örneğin, 4 saat çalışan öğrenci 4 yerine 3 alsaydı), grafikte hala yukarı yönlü genel bir eğilim (trend) gözlemlenirdi. Ancak ilişki artık “mükemmel” olmazdı ve korelasyon katsayısı 1’den daha düşük bir değere (örneğin r = 0.95 gibi) gerilerdi. Örüntü ne kadar bozulursa, korelasyon katsayısı da o kadar sıfıra yaklaşır, yani ilişkinin gücü zayıflar.

Şimdi Excel'de ders çalışma süresi ile stress seviyesi üzerindeki korelasyona bakıyoruz. Yukarıdaki adımları tekrarladığımızda aşağıdaki gibi bir serpilme diyagramı(saçılım grafiği) elde ederiz.

Bu Grafik ile de Hocamızın Anlattıkları Aşağıdaki Gibidir.

Negatif Korelasyon: Saat ve Stres Seviyesi İlişkisi

Korelasyonun yönü her zaman pozitif olmak zorunda değildir. Değişkenler arasında zıt yönlü bir ilişki de bulunabilir. Saat (bağımsız değişken) ile Stres seviyesi (bağımlı değişken) arasındaki ilişkiyi gösteren bu serpilme diyagramı, bu durumu mükemmel bir şekilde örneklemektedir.

  1. Grafiksel Yorumlama ve İlişkinin Yönü

Görsel Örüntü: Önceki pozitif korelasyon örneğinin aksine, bu grafikteki noktalar sol üstten sağ alta doğru bir yol izlemektedir. Bu görsel eğilim, negatif veya ters yönlü bir ilişkinin en net göstergesidir.

Veri ile Analiz:

En az ders çalışma saatine sahip öğrenci (X=1), en yüksek stres seviyesine (Y=5) sahiptir.

Ders çalışma saati arttıkça (X ekseninde sağa doğru ilerledikçe), stres seviyesinin sistematik bir şekilde azaldığını (Y ekseninde aşağıya doğru indiğini) gözlemliyoruz.

En çok ders çalışan öğrenci (X=5) ise en düşük stres seviyesine (Y=1) ulaşmıştır.

  1. Mükemmel Negatif Korelasyon (r = -1.0)

Daha önce tanımladığımız korelasyon kavramı ışığında bu grafiği yorumlayabiliriz:

Yön: Bir değişken (çalışma saati) artarken, diğer değişken (stres seviyesi) tutarlı bir şekilde azaldığı için bu ilişki negatif korelasyon olarak adlandırılır.

Güç: Tıpkı pozitif örnekte olduğu gibi, bu grafikteki tüm noktalar da mükemmel bir doğru üzerinde yer almaktadır. İlişkiyi bozan, istisna yaratan hiçbir gözlem yoktur. Bu durum, iki değişken arasında olabilecek en güçlü negatif doğrusal ilişkiyi ifade eder.

Korelasyon Katsayısı: Bu mükemmel ve ters yönlü ilişkinin sayısal karşılığı, korelasyon katsayısının r = -1.0 olmasıdır. Bu değer, bir değişkendeki artışın, diğer değişkende öngörülebilir ve hatasız bir azalmaya yol açtığını gösterir.

Şimdiye kadar, değişkenler arasındaki ilişkiyi serpilme diyagramı üzerinde gözlemleyerek sezgisel bir örüntü tespit ettik.

Zihnimizin bu noktalar arasında adeta bir ok veya doğru çizerek kurduğu bu bağlantıyı şimdi somutlaştıracağız.

Bir sonraki adımımız, bu görsel örüntüyü en iyi şekilde özetleyen ve matematiksel olarak ifade eden tahmin doğrusunu (trendline) grafiğin üzerine yerleştirmektir

Şimdi ise Tarih kısmındaki datayı genişletelim ve görselini yukarıdaki anlatıma göre tekrar oluşturalım

Hocamız bu aşamada aşağıdaki gibi bir anlatım yapmıştır.

Tahmin Doğrusu (Line of Prediction) ve Doğrusal Denklem

Şimdiye kadar, veri noktaları arasındaki görsel örüntüleri yorumladık. Bir sonraki kritik adım, bu görsel ilişkiyi matematiksel bir modele dönüştürmektir. Bu model, bize sadece mevcut veriyi özetlemekle kalmaz, aynı zamanda veri setimizde olmayan değerler için tahmin yapma imkanı tanır.

1. Senaryo Değişikliği: Tahmin İhtiyacını Anlamak

Bu konsepti daha net anlamak için Tarih veri setimizde kasıtlı bir değişiklik yapalım. 5. öğrenciden sonra 6. öğrencinin verisini atlayıp doğrudan 7 saat çalışan bir öğrencinin (St6) verisini ekleyelim. Yeni veri setimiz (1,1), (2,2), (3,3), (4,4), (5,5), (7,7) şeklinde olsun.

Bu durum, bizi şu temel soruyla karşı karşıya bırakır:

“Veri setimizdeki genel örüntüye (pattern) göre, 6 saat ders çalışan bir öğrencinin alması beklenen not kaçtır?”

Bu basit ve net örüntüde, zihnimiz sezgisel olarak cevabın “6” olduğunu hemen bulur. Ancak gerçek dünya verilerinde ilişkiler bu kadar açık olmayabilir. İşte bu noktada sezgisel çıkarımdan daha fazlasına, yani matematiksel bir modele ihtiyaç duyarız.

2. Tahmin Doğrusu (Trendline) ve Temel İsimlendirmeler

Serpilme diyagramındaki noktalar arasındaki genel eğilimi en iyi şekilde temsil eden doğruya Tahmin Doğrusu denir. Bu doğru, çeşitli yazılımlarda ve kaynaklarda farklı isimlerle anılabilir:

Eğilim Çizgisi (Trendline): Genellikle Excel gibi programlarda kullanılan popüler bir ifadedir.

Tahmin Doğrusu (Line of Prediction): Doğrunun temel amacını, yani tahmin yapma işlevini vurgular.

En Uygun Çizgi (Line of Best Fit): Tüm veri noktalarına ortalama olarak en yakın geçen doğru olduğunu belirtir.

En Küçük Kareler Regresyon Doğrusu (Least Squares Regression Line): Bu doğrunun hesaplandığı istatistiksel yöntemin teknik adıdır.

3. Doğrusal Denklem: İlişkinin Formülü

Bu tahmin doğrusu, aslında 1. dereceden basit bir doğrusal denklemin görsel temsilidir. Bu denklem, X’e (bağımsız değişken) bakarak Y’yi (bağımlı değişken) tahmin etmemizi sağlar. Genel formül şöyledir:

Y = β₀ + β₁X

Y: Tahmin etmek istediğimiz bağımlı değişken (Örn: Tarih Notu).

X: Tahmin yapmak için kullandığımız bağımsız değişken (Örn: Çalışma Saati).

β₁ (Eğim / Slope): X’teki her 1 birimlik değişimin, Y’de yarattığı ortalama değişimi ifade eder.

β₀ (Sabit / Intercept): X değişkeni 0 olduğunda, tahmin doğrusunun Y eksenini kestiği teorik noktadır.

Tarih notu örneğimizde bu ilişki o kadar nettir ki formül Y = X (veya daha teknik olarak Y = 0 + 1*X) şeklindedir.

Bu formül sayesinde, “6 saat çalışan öğrencinin notu kaç olur?” sorusunu sezgisel olarak değil, matematiksel olarak cevaplayabiliriz:

Beklenen Tarih Notu = 1 * (Çalışma Saati) => Beklenen Not = 1 * 6 = 6

Bu basit örnekte zihnimiz denklemi otomatik olarak kurup çözmüştür. Ancak eğim (slope) her zaman 1 olmayabilir veya ilişki bu kadar net olmayabilir. Birazdan göreceğimiz gibi, farklı eğimlere sahip veya daha dağınık verilerde, bu denklemi doğru bir şekilde hesaplamak ve tahminler yapmak için regresyon analizine ihtiyaç duyarız.

Hocamız bu aşamada tarih ile ders çalışma saatinin tahmin doğrusu formülünü Excel ile nasıl bulanacağını gösteriyor

Hocamız bu aşamada

Tarih ile ders çalışma saatinin tahmin doğrusu formülü (yukarıdaki grafik)

Fizik ile ders çalışma saatinin tahmin doğrusu formülü (aşağıdaki grafik) üzerinde anlatım yapıyor

Eğim (Slope) Kavramı ve Korelasyondan Farkı

Önceki örneklerimizde, iki değişken arasındaki ilişkinin yönünü ve gücünü korelasyon kavramıyla anladık. Şimdi, bu ilişkinin “büyüklüğünü” veya “değişim oranını” ifade eden eğim (slope) kavramını inceleyeceğiz. Bu ayrımı anlamak, regresyon analizinin temelini oluşturur.

Bunu yapmak için Tarih senaryosunu, yeni bir senaryo olan Fizik notları ile karşılaştıralım.

1. Farklı İlişki, Farklı Denklem: Fizik Notu Senaryosu

Fizik veri setini incelediğimizde yeni bir örüntü fark ederiz:

1 saat çalışan öğrencinin notu: 0.5

2 saat çalışan öğrencinin notu: 1

3 saat çalışan öğrencinin notu: 1.5

5 saat çalışan öğrencinin notu: 2.5

Bu örüntü, beklenen fizik notunun (Y), her zaman çalışma saatinin (X) tam olarak yarısı olduğunu göstermektedir. Bu ilişkiyi temsil eden tahmin doğrusu ve denklemi şu şekildedir:

Denklem: y = 0.5x

2. Eğim Katsayısı (Slope / Coefficient) Nedir?

Doğrusal regresyon denklemlerinde, x değişkeninin önünde yer alan çarpana eğim katsayısı (coefficient) denir. Bu katsayı, tahmin doğrusunun eğimini (slope) belirler.

Şimdi iki senaryomuzu bu gözle karşılaştıralım:

Senaryo Denklem (Formül) Eğim Katsayısı (Slope)
Tarih Notu y = x (yani y = 1x) 1
Fizik Notu y = 0.5x 0.5

3. Eğim Katsayısının Yorumlanması

Eğim katsayısı, bize en temel ve en önemli bilgiyi verir: Bağımsız değişkendeki (X) her 1 birimlik değişimin, bağımlı değişkende (Y) ortalama olarak kaç birimlik bir değişime yol açtığı.

Tarih Notu (Eğim = 1): Bu, “çalışma saatindeki (X) her 1 birimlik artışın, tarih notunda (Y) tam olarak 1 birimlik bir artışa neden olduğu” anlamına gelir.

Fizik Notu (Eğim = 0.5): Bu, “çalışma saatindeki (X) her 1 birimlik artışın, fizik notunda (Y) 0.5 birimlik (yani yarım puanlık) bir artışa neden olduğu” anlamına gelir.

Eğer başka bir senaryoda denklem y = 2x olsaydı, “X’teki 1 birimlik artış, Y’de 2 birimlik artışa neden olur” şeklinde yorumlayacaktık.

4. En Önemli Ayrım: Eğim ≠ Korelasyon Büyüklüğü

Bu iki kavram sıkça karıştırılsa da, tamamen farklı şeyleri ölçerler.

Korelasyon (r): İlişkinin gücünü ve mükemmelliğini ölçer. “Veri noktaları, tahmin doğrusu üzerine ne kadar kusursuz bir şekilde oturuyor?” sorusunu cevaplar.

Hem Tarih hem de Fizik grafiğinde, tüm noktalar istisnasız bir şekilde çizginin üzerinde yer alır. Dolayısıyla, her iki senaryoda da korelasyon mükemmeldir (r = +1.0).

Eğim (Slope): İlişkinin büyüklüğünü ve etki derecesini ölçer. “X 1 birim değiştiğinde, Y ne kadar değişir?” sorusunu cevaplar.

Tarih örneğinde bu etki birebirdir (eğim=1), Fizik örneğinde ise yarı yarıyadır (eğim=0.5).

Özetle: İki farklı senaryo, aynı mükemmel korelasyon gücüne (r=1.0) sahip olabilirken, tamamen farklı eğim değerlerine (etki büyüklüklerine) sahip olabilirler. Korelasyon, noktaların çizgiye ne kadar sadık kaldığıyla ilgilenirken; eğim, o çizginin ne kadar dik olduğuyla ilgilenir.

Tarih ile ders çalışma saatinin tahmin doğrusu formülü,

Fizik ile ders çalışma saatinin tahmin doğrusu formülü ve

İşletme ile ders çalışma saatinin tahmin doğrusu formülünü beraberce inceleyelim.

Üç Farklı Senaryonun Karşılaştırmalı Analizi: Eğim (Slope) Kavramının Görselleştirilmesi

Bu grafik, üç farklı senaryoyu (Tarih, Fizik ve İşletme) tek bir koordinat sisteminde bir araya getirerek, eğim (slope) kavramını ve doğrusal denklemler arasındaki farkı görsel olarak karşılaştırmamıza olanak tanır. Her bir doğru, aynı bağımsız değişkene (Saat) karşılık farklı bir bağımlı değişkenin (Not) ilişkisini modellemektedir.

İşletme Notu: y = 2x (Yeşil Doğru)

Tarih Notu: y = x (Mavi Doğru)

Fizik Notu: y = 0.5x (Kırmızı Doğru)

Karşılaştırma Tablosu

Senaryo Denklem Eğim (Slope) Katsayısı Eğimin Yorumu Korelasyon (r)
İşletme y = 2x 2 Çalışma saatindeki her 1 birimlik artış, İşletme notunu ortalama 2 birim artırır. +1.0
Tarih y = x 1 Çalışma saatindeki her 1 birimlik artış, Tarih notunu ortalama 1 birim artırır. +1.0
Fizik y = 0.5x 0.5 Çalışma saatindeki her 1 birimlik artış, Fizik notunu ortalama 0.5 birim artırır. +1.0

Grafikten Çıkarılacak Temel Sonuçlar

1. Eğim ve Doğrunun Dikliği:

Grafik, eğim katsayısının (slope) doğrudan doğrunun dikliğini belirlediğini net bir şekilde göstermektedir.

En düşük eğime sahip olan Fizik (0.5) doğrusu en yatık olandır.

En yüksek eğime sahip olan İşletme (2) doğrusu ise en dik olandır.

Tarih (1) doğrusu ise bu ikisinin arasında yer alır.

Eğim katsayısı, X eksenindeki bir birimlik ilerlemenin, Y ekseninde ne kadarlık bir “tırmanışa” neden olduğunu görsel olarak temsil eder.

2. Tüm Senaryolarda Mükemmel Korelasyon:

Bu üç senaryonun en önemli ortak noktası, her birinde korelasyon katsayısının (r) +1.0 olmasıdır. Çünkü her üç durumda da veri noktaları, kendi tahmin doğrularının üzerine istisnasız ve kusursuz bir şekilde oturmaktadır. Bu durum, eğim ve korelasyon arasındaki temel farkı anlamak için en güçlü görsel kanıttır.

3. Özet ve Ana Fikir:

Bir bağımsız değişken ile farklı bağımlı değişkenler arasındaki ilişkiler:

Aynı mükemmel güce (korelasyon) sahip olabilirler: Her üç durumda da çalışma saati, notu mükemmel bir şekilde tahmin etmektedir. İlişkilerde hiç “bozulma” veya “sapma” yoktur.

Ancak tamamen farklı etki büyüklüklerine (eğim) sahip olabilirler: Çalışma saatinin “getirisi” her ders için farklıdır. En kârlı ders, her bir saatlik çalışmaya 2 puan veren İşletme iken, en az getirisi olan ders her saate 0.5 puan veren Fizik’tir.

Sonuç olarak, bir ilişkinin ne kadar tutarlı olduğunu korelasyon ile ölçerken, o ilişkinin etki miktarını veya değişim oranını eğim (slope) ile ölçeriz. Bu grafik, bu iki temel istatistiksel kavramın birbirinin yerine kullanılamayacağını ve farklı sorulara cevap verdiğini göstermektedir.

İşletme ile ders çalışma saatinin tahmin doğrusu formülü ve

Stres seviyesi ile ders çalışma saatinin tahmin doğrusu formülünü beraberce inceleyelim.

Pozitif ve Negatif İlişkilerin Karşılaştırılması: Sabit Değer (Intercept) Kavramı

Bu grafikte, aynı bağımsız değişken olan Saat’in, iki farklı bağımlı değişken (İşletme Notu ve Stres Seviyesi) üzerindeki zıt yönlü etkilerini modelleyen iki tahmin doğrusu bir arada sunulmuştur. Bu karşılaştırma, regresyon denkleminin temel bileşenlerini tam olarak anlamamızı sağlar.

İşletme Modeli (Pozitif Eğim): y = 2x (Mavi Doğru)

Stres Modeli (Negatif Eğim ve Sabit Değer): y = -x + 6 (Kırmızı Doğru)

1. İşletme Modeli Analizi (y = 2x)

Denklem: Bu denklemi y = 0 + 2x olarak da okuyabiliriz.

Eğim (Slope / β₁): Katsayı +2’dir. Bu, çalışma saatindeki her 1 birimlik artışın, İşletme notunu ortalama 2 birim artırdığını gösterir. Doğrunun yukarı yönlü ve dik olması bu pozitif eğimden kaynaklanır.

Sabit Değer (Intercept / β₀): Denklemde ayrıca bir sabit değer yazılmadığı için 0’dır. Bu, tahmin doğrusunun orijinden (0,0 noktası) başladığı anlamına gelir. Yani, modelimize göre 0 saat çalışan bir öğrencinin beklenen İşletme notu 0’dır.

2. Stres Modeli Analizi (y = -x + 6)

Bu denklem, regresyon modelinin iki temel bileşenini de açıkça göstermektedir.

Eğim (Slope / β₁): Katsayı -1’dir (-x ifadesi -1x anlamına gelir).

Yorumu: Eğimdeki negatif işaret, ilişkinin yönünün ters olduğunu gösterir. Buna göre, çalışma saatindeki her 1 birimlik artış, stres seviyesini ortalama 1 birim azaltmaktadır. Doğrunun sol üstten sağ alta doğru inmesi bu negatif eğimin görsel sonucudur.

Sabit Değer (Intercept / β₀): Denklemdeki sabit sayı +6’dır.

Tanımı: Sabit değer (aynı zamanda kesişim noktası veya constant olarak da bilinir), tahmin doğrusunun Y eksenini kestiği noktayı ifade eder. Matematiksel olarak, bu değer bağımsız değişken (X) 0 olduğunda, bağımlı değişkenin (Y) alması beklenen değerdir.

Yorumu: Bu modele göre, hiç ders çalışmayan (X=0) bir öğrencinin beklenen stres seviyesi 6’dır. Bu, modelin “başlangıç noktasıdır”.

Grafikten Çıkarılacak Temel Sonuçlar

Bu iki denklemi karşılaştırmak, doğrusal regresyonun temel mantığını özetler:

Özellik İşletme Modeli (y = 2x) Stres Modeli (y = -x + 6) Anlamı
Eğim (Slope) +2 -1 Değişim Oranı ve Yönü: X 1 birim değiştiğinde Y’nin ne kadar ve ne yönde değiştiğini gösterir.
Sabit (Intercept) 0 +6 Başlangıç Noktası: X sıfır iken Y’nin beklenen değerini gösterir.
Korelasyon Mükemmel Pozitif (r = +1.0) Mükemmel Negatif (r = -1.0) İlişkinin Gücü: Her iki model de kendi verilerini mükemmel bir şekilde açıkladığı için korelasyon güçleri (mutlak değer olarak) aynıdır.

Sonuç olarak, y = 2x denklemi orijinden başlayan ve hızla yükselen pozitif bir ilişkiyi modellerken, y = -x + 6 denklemi Y eksenini 6 noktasından keserek başlayan ve daha yavaş bir oranda azalan negatif bir ilişkiyi modellemektedir. Bu iki temel bileşen—eğim ve sabit değer—herhangi bir basit doğrusal ilişkinin tam tanımını oluşturur.

Stres seviyesi ile ders çalışma saatinin tahmin doğrusu formülü ile ilgili hocamızın anlatımı

Regresyon Denkleminin İkinci Bileşeni: Sabit Değer (Intercept / Constant)

Şimdiye kadar, doğrusal denklemin eğim (slope) bileşenine odaklandık. Ancak tam bir doğrusal modeli anlamak için ikinci temel bileşen olan sabit değeri de incelememiz gerekir. Bu kavramı en net şekilde Stres Seviyesi ile Ders Çalışma Saati arasındaki negatif korelasyonu modelleyen grafikte görebiliriz.

1. Stres Modeli Denkleminin Analizi

Saat ve Stres arasındaki ilişkiyi gösteren tahmin doğrusunun denklemi şu şekildedir:

y = -x + 6

Bu denklem, genellikle y = 6 - x şeklinde de ifade edilebilir. Ancak istatistiksel gösterimde standart form, bağımsız değişkenin (x) önce yazılmasıdır. Bu denklemde, daha önce öğrendiğimiz eğim (slope) -1’dir. Şimdi odaklanacağımız yeni kavram ise denklemdeki +6 sayısıdır.

2. Sabit Değer (Intercept) Nedir ve Ne Anlama Gelir?

Doğrusal regresyon denkleminde, bağımsız değişkenden (x) etkilenmeyen bu sabit sayıya çeşitli isimler verilir:

Sabit Değer (Constant): Modelin değişmeyen temelini oluşturduğu için bu isim kullanılır.

Kesişim Noktası (Intercept): Grafiksel anlamını en iyi ifade eden terimdir.

β₀ (Beta-naught) veya b₀: İstatistiksel formüllerdeki sembolik gösterimidir.

Bu değerin üç temel anlamı vardır:

  1. Matematiksel Anlamı: Bağımsız değişken (X) 0 değerini aldığında, bağımlı değişkenin (Y) alması beklenen teorik değerdir.

Formülümüze x=0 değerini yerleştirdiğimizde: y = -(0) + 6, sonuç y = 6 olur.

  1. Grafiksel Anlamı: Tahmin doğrusunun (eğrinin) Y eksenini kestiği noktadır. Grafiği sola doğru uzattığımızda, X’in 0 olduğu dikey eksene tam olarak 6 noktasında değeceğini görürüz.
  1. Kavramsal Anlamı: Modelin “başlangıç noktasını” veya “temel seviyesini” temsil eder.

Yorumu: Bu modele göre, bir öğrenci hiç ders çalışmadığında (X=0), beklenen başlangıç stres seviyesi 6’dır. Başka bir deyişle, her şey 6 seviyesinden başlar ve çalışma saati arttıkça bu seviye düşer.

3. Diğer Modellerle Karşılaştırma

Önceki örneklerimizde (Tarih, Fizik, İşletme) bir sabit değerden bahsetmedik çünkü bu modellerde sabit değer (intercept) 0 idi.

Örneğin y = x denkleminin tam hali y = 0 + 1x’tir. Bu, 0 saat çalışan bir öğrencinin beklenen notunun 0 olduğu ve tahmin doğrusunun doğrudan orijinden (0,0 noktası) başladığı anlamına gelir.

Stres modelindeki +6 sabiti ise bize, modelimizin orijinden başlamadığını, Y eksenini 6 noktasından keserek daha yukarıdan başladığını gösterir. Böylece, bir doğrusal modeli tam olarak tanımlayan iki temel unsuru öğrenmiş olduk:

Eğim (Slope): Doğrunun yönünü ve dikliğini (değişim oranını) belirler.

Sabit Değer (Intercept): Doğrunun Y eksenini nerede kestiğini (başlangıç noktasını) belirler.

Hocamız bu aşamada bir sonraki Excel veri seti ile anlatım yapmaya başlıyor.

Veri Setimizi Tanıyalım:

Bu bölümde yapılacak olan korelasyon ve regresyon analizleri, N=20 öğrenciden toplanan çok değişkenli bir veri setine dayanmaktadır. Veri seti, öğrencilerin akademik performansları, yaşam tarzı alışkanlıkları, psikolojik durumları ve sosyo-demografik özelliklerine dair zengin bilgiler içermektedir.

Her bir öğrenci (gözlem birimi), benzersiz bir ID numarası ile tanımlanmıştır. Veri setinde yer alan değişkenler, açıklamaları ve istatistiksel ölçek tipleri aşağıdaki tabloda özetlenmiştir.

Değişken Kategorisi Değişken Adı (Örnek) Açıklama Değişken Tipi ve Ölçeği
Akademik Performans Matematik_Notu Matematik dersinden alınan not (100’lük sistem). Sürekli (Oran)
Istatistik_Notu İstatistik dersinden alınan not (100’lük sistem). Sürekli (Oran)
Tarih_Notu Tarih dersinden alınan not (100’lük sistem). Sürekli (Oran)
Beklenen_GPA Öğrencinin dönem sonu için beklediği not ortalaması. Sürekli (Oran, 0-4 aralığında)
Yaşam Tarzı / Zaman Kullanımı Ders_Calisma_Saati Haftalık ortalama ders çalışma süresi (saat). Sürekli (Oran)
Internet_Suresi Haftalık ortalama internet kullanım süresi (saat). Sürekli (Oran)
Oyun_Suresi Haftalık ortalama oyun oynama süresi (saat). Sürekli (Oran)
Uyku_Suresi Günlük ortalama uyku süresi (saat). Sürekli (Oran)
Yol_Suresi Günlük/haftalık ulaşımda harcanan süre (saat). Sürekli (Oran)
Gonulluluk_Suresi Haftalık gönüllülük faaliyetlerine ayrılan süre (saat). Sürekli (Oran)
Psikolojik / Tutumsal Stres_Seviyesi Genel stres düzeyini belirten skor. Sürekli (Aralık, 0-100 aralığında)
Saglik_Durumu Bireyin beyan ettiği genel sağlık durumu. Sürekli (Aralık, -10’dan +10’a)
Egitim_Memnuniyeti Alınan eğitimden genel memnuniyet düzeyi. Sıralı (Ordinal, 0-10 aralığında)
Motivasyon Akademik motivasyon düzeyi. Sıralı (Ordinal, 0-10 aralığında)
Sosyo-Ekonomik Burs_Miktari Alınan aylık/dönemlik burs miktarı. Sürekli (Oran)

Metodolojik Not: Egitim_Memnuniyeti ve Motivasyon gibi değişkenler doğası gereği sıralı (ordinal) ölçektedir. Ancak, bu tür 10’lu Likert tipi ölçekler, uygulamada parametrik testlerin (korelasyon, regresyon vb.) yapılabilmesi için sıklıkla aralıklı (interval) ölçek gibi kabul edilmektedir. Yapılacak analizlerde bu varsayım altında hareket edilecektir.

Bu kapsamlı veri seti, değişkenler arasında çok sayıda potansiyel ilişkiyi (örneğin, uyku süresi ile stres seviyesi, oyun süresi ile akademik başarı, motivasyon ile beklenen GPA vb.) keşfetmek için zengin bir zemin sunmaktadır.

İstatistik ders skoru ile ders çalışma saatinin arasında bir ilişki var mı?

Gerekli düzeltmeleri yaptıktan sonra aşağıdaki gibi bir görünüm elde ederiz.

Saçılım (Serpme) Grafiği Yorumu:

  1. İlk Bakışta Görsel Analiz (Visual Inspection)

Grafiğin ilk incelenmesi, iki değişken arasında anlamlı bir ilişki olduğuna dair güçlü kanıtlar sunmaktadır. Bu ilişkinin temel özellikleri şunlardır:

Yön (Direction): Veri noktaları genel olarak sol alttan sağ üste doğru bir yönelim sergilemektedir. Bu durum, iki değişken arasında pozitif yönlü bir ilişki olduğunu göstermektedir.

Biçim (Form): Noktalar, bir eğri değil, genel hatlarıyla doğrusal (lineer) bir örüntü etrafında toplanmıştır. Bu, ilişkinin doğrusal bir regresyon modeli ile temsil edilmeye uygun olduğunu düşündürür.

Güç (Strength): Noktalar, önceki örneklerde olduğu gibi mükemmel bir doğru üzerinde olmasa da, rastgele bir bulut şeklinde de değildir. Aksine, pozitif eğimli dar bir koridor veya eksen etrafında kümelenmişlerdir. Bu durum, ilişkinin orta ile yüksek düzeyde güçlü olduğuna işaret eder.

  1. Detaylı Gözlemsel Çıkarım

Bu pozitif yönlü eğilim, eksenlerin farklı bölgelerindeki veri yoğunluğuna bakılarak teyit edilebilir:

Düşük Değerler Bölgesi: X ekseninin düşük değerlerinde (örneğin, 10 saatten az çalışan öğrenciler), Y eksenindeki karşılıkları olan istatistik notları da büyük ölçüde düşük ve orta aralıktadır (genellikle 60’ın altında).

Yüksek Değerler Bölgesi: X ekseninin yüksek değerlerinde (örneğin, 15 saatten fazla çalışan öğrenciler), istatistik notları da belirgin bir şekilde grafiğin üst kısımlarında yoğunlaşmıştır (genellikle 70’in üzerinde).

Bu sistematik dağılım, “ders çalışma saati arttıkça, istatistik notu da artma eğilimindedir” hipotezini görsel olarak kuvvetle desteklemektedir.

  1. Sonuç: Stokastik (Olasılıksal) İlişki

Bu grafiğin en önemli özelliği, önceki mükemmel (r=1.0) örneklerden farklı olarak, noktaların tahmin doğrusu etrafında saçılım göstermesidir. Bu, gerçek dünya verilerinin tipik bir özelliğidir ve ilişkinin stokastik olduğunu gösterir. Yani, ders çalışma saati istatistik notu için önemli bir belirleyici olsa da, notu etkileyen tek faktör değildir. Diğer faktörler (örneğin, ön bilgi, derse ilgi, motivasyon, zeka vb.) modele “gürültü” veya “hata” (error) olarak yansıyan ve noktaların mükemmel bir doğrudan sapmasına neden olan bir varyans yaratır.

Önsel Değerlendirme: Herhangi bir sayısal hesaplama yapmadan önce, bu grafiğin analizi bize iki değişken arasında istatistiksel olarak anlamlı, pozitif yönlü ve muhtemelen güçlü bir korelasyon olduğunu söylemektedir. Bir sonraki adım, bu görsel çıkarımı sayısal metriklerle (korelasyon katsayısı, regresyon denklemi vb.) test etmek olacaktır.