İlk Proje

R yükleme

markdown başlangıç

Web sayfasını hazırlama

Internete yükleme

FORMUL

\[A=\frac{1}{n}\Sigma^n_i(a_i)\]

library(WDI)
## Warning: package 'WDI' was built under R version 4.3.3
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
# Örnek enflasyon verilerini oluşturalım
years <- c(2015, 2016, 2017, 2018, 2019, 2020, 2021)
ukraine_inflation <- c(48.7, 12.4, 13.9, 9.8, 4.1, 5.2, 7.3)
somalia_inflation <- c(3.2, 4.5, 5.8, 7.1, 8.4, 9.7, 11.0)

# Verileri bir veri çerçevesine dönüştürelim
inflation_data <- data.frame(Year = years,
                             Ukraine = ukraine_inflation,
                             Somalia = somalia_inflation)

# Grafik çizimi
library(ggplot2)

ggplot(inflation_data, aes(x = Year)) +
  geom_line(aes(y = Ukraine, color = "Ukraine")) +
  geom_line(aes(y = Somalia, color = "Somalia")) +
  labs(title = "Ukraine vs Somalia Enflasyon",
       x = "Yıl",
       y = "Enflasyon Oranı (%)",
       color = "Ülke") +
  scale_color_manual(values = c("Ukraine" = "blue", "Somalia" = "red")) +
  theme_minimal()

##Makine Öğrenmesi Açıklayın?

Makine öğrenmesi, bilgisayarların verileri analiz etmesi ve desenleri belirlemesi için kullanılan bir yapay zeka dalıdır. Bu desenler, daha sonra tahminler yapmak, kararlar vermek veya görevleri gerçekleştirmek için kullanılabilir. Makine öğrenimi, belirli bir talimat dizisi yerine veri üzerinde deneyimlerden öğrenme prensibine dayanır.

Makine öğrenimi, genellikle üç ana kategoride incelenir: Gözetimli Öğrenme (Supervised Learning): Bu tür öğrenme, bir girdi ve bu girdiye karşılık gelen bir çıktı arasındaki ilişkiyi modellemeye odaklanır. Algoritma, önceden etiketlenmiş (etiketlenmiş) veri kümesini kullanarak bu ilişkiyi öğrenir. Örneğin, bir evin özelliklerini (odaların sayısı, konumu, vb.) girdi olarak alıp fiyatını çıktı olarak tahmin etmeyi öğrenen bir model.

Denetimsiz Öğrenme (Unsupervised Learning): Bu tür öğrenmede, verilerdeki desenleri veya yapıları bulmak için algoritmalardan faydalanılır. Bu durumda veri etiketlenmemiş ve algoritma, veri arasındaki doğal grupları veya ilişkileri tanımlamak için kullanılır. Örneğin, benzer özelliklere sahip veri noktalarını bir araya getirerek pazar segmentlerini belirleyen bir kümeleme algoritması.

Pekiştirmeli Öğrenme (Reinforcement Learning): Bu tür öğrenmede, bir sistem, bir ortamla etkileşime girer ve bu ortamda belirli bir hedefi en iyi şekilde elde etmek için deneyerek öğrenir. Sistem, çevreden aldığı geri bildirimlere (ödüller veya cezalar) dayanarak eylemlerini optimize etmeye çalışır. Örneğin, bir robotun belirli bir oyunu oynamayı öğrenmesi veya bir otonom aracın trafikte güvenli bir şekilde sürmesini öğrenmesi gibi.

Makine öğrenimi, büyük miktarda veriyi işleyebilen ve bu verilerdeki desenleri algılayabilen algoritmalar geliştirme konusunda büyük bir potansiyele sahiptir. Bu algoritmalar, birçok endüstride kullanılır, örneğin sağlık, finans, ulaşım, e-ticaret ve daha birçok alanda. Ancak, makine öğrenimi algoritmaları, doğru sonuçlar üretebilmek için doğru veriye ve uygun bir modelleme yaklaşımına ihtiyaç duyar. Ayrıca, algoritmaların eğitimi, model seçimi ve sonuçların yorumlanması gibi bazı zorlukları da içerir

kaggle projesi

##spaceship titanic (kaggel tanıtımı)

Spacehip Titanic (Kaggle Tanıtımı) “2912 yılına hoş geldiniz, burada veri bilimi becerilerinizin bir kozmik gizemi çözmek için gerektiği bir zamandayız. Dört ışık yılı uzaklıktan bir ileti aldık ve durum iyi görünmüyor.

Uzay Gemisi Titanic, bir ay önce fırlatılan bir yıldızlararası yolcu gemisiydi. Yaklaşık 13.000 yolcuyla yola çıkan gemi, Güneş sistemimizden üç yeni yaşanabilir yıldız etrafında dönen gezegenlere göçmenleri taşıyarak ilk seferine başladı.

İlk varış noktası olan 55 Cancri E’ye, Alfa Centauri’yi dolaşırken, dikkatsiz Uzay Gemisi Titanic, bir toz bulutunun içinde gizlenmiş bir uzay-zaman anormalliğiyle çarpıştı. Ne yazık ki, adını taşıdığı gemiye bin yıl önceki kaderle benzer bir kaderi paylaştı. Gemi bütünlüğünü korudu, ancak neredeyse yolcuların yarısı alternatif bir boyuta taşındı!

Kurtarma ekiplerine yardım etmek ve kayıp yolcuları kurtarmak için, uzay gemisinin hasar görmüş bilgisayar sisteminden kurtarılan kayıtları kullanarak hangi yolcuların anormallik tarafından taşındığını tahmin etmeniz isteniyor.

Onları kurtarmaya yardım edin ve tarihi değiştirin!”

Ortalama, standart sapma, kovaryans ve korelasyon nedir?

ortalama nedir

“Ortalama”, bir veri kümesindeki sayıların genel bir temsilini ifade eden bir terimdir. Bir veri kümesindeki sayıların toplamının sayı adedine bölünmesiyle bulunur.

Ortalama, veri setinin genel eğilimini anlamak için kullanışlı bir ölçüdür. Örneğin, bir sınıftaki öğrencilerin notlarının ortalama alınması, sınıfın genel performansını anlamak için kullanılabilir.

Standart sapma nedir

Standart sapma, bir veri kümesindeki değerlerin ortalamadan ne kadar uzaklaştığını ölçen bir istatistiksel ölçüdür. Yani, bir veri setinin ne kadar homojen veya heterojen olduğunu belirlemeye yardımcı olur. Bir veri setindeki her bir değerin ortalamadan ne kadar farklı olduğunu bulmak için standart sapma hesaplanır.

Standart sapma formülü

\[\sigma = \sqrt \frac {\Sigma^N_i (X_i-\bar{X})^2}{N} \] ### kovaryans nedir?

Kovaryans, iki değişken arasındaki ilişkinin değişkenliklerini ölçen bir istatistiksel terimdir. Özellikle, bu iki değişkenin birlikte nasıl değiştiğini ölçmek için kullanılır. Kovaryans, bu değişkenlerin birlikte artıp azaldığı durumları ve bunların ne kadar birbirine bağlı olduğunu belirlemeye yardımcı olur.

kovaryans formülü

\[cov(X,Y)=\frac {\Sigma^n_i (X_i-X)(Y_i-Y)}{n-1}\]

korelasyon nedir ?

korelasyon bir istatistik terimi olup, iki değişken arasındaki ilişkiyi ölçen bir ölçüdür. Bu ilişki, değişkenlerin birlikte nasıl değiştiğini ve birbirlerine ne kadar bağımlı olduklarını belirler. Daha basit bir tanımla, korelasyon, iki değişken arasındaki ilişkinin doğasını ve yönünü belirler. İki değişken arasında pozitif bir korelasyon varsa, bir değişken arttığında diğerinin de arttığı görülür. Negatif bir korelasyon ise bir değişken arttığında diğerinin azaldığını gösterir

korelasyon formülü

\[ R = \frac {\Sigma (x_i-\bar{x})(y_i-\bar{y})}{ \sqrt {\Sigma (x_i-\bar{x})^2 \Sigma (y_i-\bar{y})}}\]

Train ve test nedir?

“Train” ve “test”, makine öğrenimi ve veri bilimi gibi alanlarda kullanılan terimlerdir.

Eğitim (Train):

Eğitim aşamasında, bir makine öğrenimi modeli belirli bir veri kümesi üzerinde eğitilir. Bu veri kümesi genellikle etiketlenmiş verilerden oluşur, yani girdi özelliklerinin yanı sıra her bir veri örneği için doğru çıktılar (etiketler) da bulunur. Makine öğrenimi modeli, eğitim veri kümesindeki desenleri öğrenir ve bu desenleri kullanarak belirli bir görevi (örneğin, sınıflandırma veya regresyon) gerçekleştirmek için optimize edilir. Eğitim aşamasında, model genellikle belirli bir algoritma ve hiperparametreler kullanılarak eğitilir. Amacı, eğitim veri kümesindeki hata veya kaybı minimize etmektir. Test:

Test aşamasında, eğitilmiş model başka bir veri kümesi üzerinde değerlendirilir. Bu veri kümesi, genellikle eğitim veri kümesinden farklıdır ve makine öğrenimi modelinin gerçek dünya verileri üzerinde ne kadar iyi performans gösterdiğini ölçmek için kullanılır. Test veri kümesi genellikle aynı formatta olup aynı özellikleri içerir, ancak model tarafından daha önce görülmemiş verilerden oluşur. Test aşamasında, modelin tahminlerinin gerçek değerlerle karşılaştırılması ve modelin performansının ölçülmesi için çeşitli değerlendirme metrikleri kullanılır. Bu metrikler, modelin ne kadar iyi çalıştığını belirlemek için kullanılabilir ve aşırı uydurma (overfitting) gibi olası problemleri tanımlamak için yardımcı olabilir. Bu iki aşama, makine öğrenimi modelinin eğitilmesi, doğrulanması ve nihayetinde gerçek dünya verileri üzerinde uygulanması için kritik öneme sahiptir.

library(readr)
## Warning: package 'readr' was built under R version 4.3.3
test <- read_csv("test.csv")
## Rows: 4277 Columns: 13
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (5): PassengerId, HomePlanet, Cabin, Destination, Name
## dbl (6): Age, RoomService, FoodCourt, ShoppingMall, Spa, VRDeck
## lgl (2): CryoSleep, VIP
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
train <- read_csv("train.csv")
## Rows: 8693 Columns: 14
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (5): PassengerId, HomePlanet, Cabin, Destination, Name
## dbl (6): Age, RoomService, FoodCourt, ShoppingMall, Spa, VRDeck
## lgl (3): CryoSleep, VIP, Transported
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
library(rmarkdown)
paged_table(train)
paged_table(test)