.R yükledik
.R Markdown başlangıç
.Web sayfası hazırlandık
.İnternete yükledik
\[ F=G*\frac{m_1*m_2}{r^2} \]
library(WDI)
library(ggplot2)
# Gerekli paketleri yükleyin
library(ggplot2)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# İtalya ve Fransa'nın enflasyon verilerini içeren bir veri çerçevesi oluşturun
# Bu verileri manuel olarak girmek yerine, uygun bir kaynaktan çekebilirsiniz
# Örneğin, Eurostat veri tabanından alabilirsiniz.
enflasyon_verileri <- data.frame(
Yıl = c(2018, 2019, 2020, 2021),
İtalya = c(1.1, 0.6, 0.1, 1.2), # İtalya'nın enflasyon oranları
Fransa = c(1.8, 1.1, 0.5, 1.6) # Fransa'nın enflasyon oranları
)
# Verileri uzun formata dönüştürün
enflasyon_verileri <- enflasyon_verileri %>%
tidyr::pivot_longer(cols = c("İtalya", "Fransa"), names_to = "Ülke", values_to = "Enflasyon")
# Grafik oluşturun
grafik <- ggplot(enflasyon_verileri, aes(x = Yıl, y = Enflasyon, color = Ülke)) +
geom_line() +
geom_point() +
labs(title = "İtalya ve Fransa'nın Enflasyon Oranları (2018-2021)",
x = "Yıl",
y = "Enflasyon Oranı",
color = "Ülke") +
theme_minimal()
# Grafiği görüntüleyin
print(grafik)
Makine öğrenimi, bilgisayar sistemlerinin deneyim veya veri aracılığıyla kendilerini geliştirmesini sağlayan bir yapay zeka dalıdır. Temelde, makine öğrenimi modelleri, belirli bir görevi gerçekleştirmek için verilerden desenleri öğrenir ve bu desenleri kullanarak yeni verilerde tahminler yapabilir veya kararlar verebilirler.
Makine öğrenimi genellikle iki ana kategori altında incelenir: denetimli ve denetimsiz öğrenme.
Denetimli Öğrenme (Supervised Learning): Bu yaklaşımda, modelin eğitildiği veri seti etiketlenmiştir, yani her giriş örneği için hedef çıktıları vardır. Model, bu giriş-veri çiftleri üzerinden desenleri öğrenir ve yeni veri noktaları için tahminler yapmak için bu desenleri kullanabilir. Örnek algoritmalar arasında lineer regresyon, karar ağaçları, destek vektör makineleri (SVM) ve yapay sinir ağları (ANN) bulunur.
Denetimsiz Öğrenme (Unsupervised Learning): Bu yöntemde, veri seti etiketlenmemiştir ve model, giriş verilerindeki yapıları veya desenleri öğrenmeye çalışır. Genellikle, verileri gruplamak (kümeleme) veya boyut azaltmak gibi görevler için kullanılır. Örnek algoritmalar arasında k-means kümeleme, hiyerarşik kümeleme, PCA (Principal Component Analysis) ve GMM (Gaussian Mixture Models) bulunur.
Bunlar temel kategorilerdir, ancak makine öğrenimi, bu kategorilerin ötesinde birçok alt dal ve özel teknik içerir. Örneğin, destek vektör makineleri (SVM) ve karar ağaçları gibi denetimli öğrenme algoritmaları karmaşık veri setlerini işlemek için kullanılabilirken, derin öğrenme gibi özel yapay sinir ağı yapıları daha karmaşık veri yapılarını modellemek için kullanılır. Makine öğrenimi, tahmin, sınıflandırma, kümeleme, boyut azaltma ve daha pek çok görevde kullanılabilir.
Makine öğrenimi, büyük miktarda veriye ve güçlü hesaplama kaynaklarına dayanır. Veri bilimi alanında, makine öğrenimi, veri analizi, tahmin, örüntü tanıma ve karar destek sistemleri gibi birçok uygulama için temel bir araçtır.
Hoş geldiniz 2912 yılına, burada veri bilimi yeteneklerinizin bir kozmik gizemi çözmek için gerektiği bir yerdesiniz. Dört ışık yılı uzaktan bir ileti aldık ve durum pek iç açıcı değil.
Uzay Gemisi Titanic, bir ay önce fırlatılan yıldızlar arası bir yolcu gemisiydi. Yaklaşık 13,000 yolcuyla donatılmış olarak, gemi, güneş sistemimizden ayrılarak, yakındaki yıldızlar etrafında dönen üç yeni yaşanabilir ötegezegenine göçmen taşıyan ilk seferine çıktı.
Alpha Centauri’yi dönerken ilk varış noktasına - kavurucu 55 Cancri E’ye - ulaşma yolunda, dikkatsiz Uzay Gemisi Titanic, bir toz bulutu içinde gizlenmiş bir uzay-zaman anormalliği ile çarpıştı. Maalesef, bin yıl öncesinin adını taşıyan gemi gibi benzer bir kaderi paylaştı. Gemisi sağlam kalsa da, yolcuların neredeyse yarısı alternatif bir boyuta taşındı!
Kurtarma ekiplerine yardımcı olmak ve kaybolan yolcuları kurtarmak için, sizi geminin hasar görmüş bilgisayar sisteminden kurtarılan kayıtları kullanarak anomali tarafından taşınan hangi yolcuların olduğunu tahmin etmeye çağırıyoruz.
Onları kurtarmaya yardımcı olun ve tarihi değiştirin!
“Ortalama”, bir veri kümesindeki değerlerin genel bir temsilidir. Bir veri kümesindeki tüm değerlerin toplamının, veri noktalarının sayısına bölünmesiyle bulunur. Ortalama, veri setinin merkezini belirlemek için sıkça kullanılan bir istatistiksel ölçümdür.
\[ \bar{X} = \frac {\Sigma^n_İ (X_i)}{n} \] ### Örnek:
# Örnek veri kümesi
veri <- c(5, 10, 15, 20, 25)
# Veri kümesinin ortalamasını hesapla
ortalama <- mean(veri)
# Sonucu yazdır
print(ortalama)
## [1] 15
Standart sapma, bir veri kümesindeki değerlerin ne kadar değişkenlik gösterdiğini ölçen bir istatistiksel ölçümdür. Daha düşük bir standart sapma, veri setindeki değerlerin ortalama etrafında daha sıkı bir şekilde toplandığını gösterirken, daha yüksek bir standart sapma, değerlerin ortalama etrafında daha dağılmış olduğunu gösterir.
Standart sapma, bir veri kümesindeki her bir değerin ortalama ile arasındaki farkın karesinin toplamının, veri noktalarının sayısına bölünmesiyle hesaplanır. Daha sonra bu değerin karekökü alınarak standart sapma elde edilir.
\[ \sigma = \sqrt \frac {\Sigma^N_i (X_i-\bar{X})^2}{N} \] ### Örnek:
# Örnek veri kümesi
veri <- c(5, 10, 15, 20, 25)
# Veri kümesinin standart sapmasını hesapla
standart_sapma <- sd(veri)
# Sonucu yazdır
print(standart_sapma)
## [1] 7.905694
Korelasyon, iki değişken arasındaki ilişkinin gücünü ve yönünü ölçen istatistiksel bir ölçüdür. Bu ölçü, değişkenler arasındaki ilişkinin ne kadar güçlü olduğunu ve bu ilişkinin hangi yönde olduğunu belirlemeye yardımcı olur. Pozitif korelasyon, bir değişkenin değeri artarken diğer değişkenin de arttığını ifade ederken, negatif korelasyon ise bir değişkenin değeri artarken diğer değişkenin azaldığını ifade eder. Korelasyon katsayısı, genellikle -1 ile +1 arasında bir değer alır.
Korelasyon katsayısı, Pearson korelasyon katsayısı veya Pearson r katsayısı olarak da adlandırılır.
\[ R = \frac {\Sigma (x_i-\bar{x})(y_i-\bar{y})}{ \sqrt {\Sigma (x_i-\bar{x})^2 \Sigma (y_i-\bar{y})}} \]
# Örnek veri seti oluşturma
veri <- data.frame(
x = c(10, 20, 30, 40, 50), # x değişkeni
y = c(15, 25, 35, 45, 55) # y değişkeni
)
# Veri setini gösterme
print(veri)
## x y
## 1 10 15
## 2 20 25
## 3 30 35
## 4 40 45
## 5 50 55
# Korelasyonu hesaplama
korelasyon <- cor(veri$x, veri$y)
# Sonucu yazdırma
print(paste("x ve y değişkenleri arasındaki korelasyon katsayısı:", korelasyon))
## [1] "x ve y değişkenleri arasındaki korelasyon katsayısı: 1"
Kovaryans, iki rassal değişken arasındaki ilişkinin derecesini ölçen bir istatistiksel ölçüdür. İki değişken arasındaki ilişkinin ne kadar güçlü olduğunu ve bu ilişkinin ne yönde olduğunu gösterir. Pozitif bir kovaryans, bir değişkenin değerinin artarken diğer değişkenin değerinin de arttığını gösterirken, negatif bir kovaryans, bir değişkenin değerinin artarken diğer değişkenin değerinin azaldığını gösterir.
Kovaryans, iki değişkenin ortalamaları arasındaki çapraz çarpımın ortalaması alınarak hesaplanır.
Kovaryansın birkaç önemli özelliği vardır:
Pozitif bir kovaryans, iki değişken arasında doğrusal bir ilişkinin olduğunu gösterir. Negatif bir kovaryans, iki değişken arasında ters orantılı bir ilişkinin olduğunu gösterir. Kovaryansın mutlak değeri, ilişkinin gücünü gösterir. Yüksek mutlak değerli kovaryans, güçlü bir ilişkiyi gösterirken, düşük mutlak değerli kovaryans, zayıf bir ilişkiyi gösterir. Kovaryansın birimi, değişkenlerin birimlerinin çarpımıdır. Bu nedenle, kovaryansın değeri, birimlerin büyüklüğüne bağlı olarak değişebilir.
\[ {cov} (X,Y) = \frac {\Sigma (X_i-X)(Y_i-Y)}{n-1} \] ### Örnek:
# İki değişken arasındaki örnek veri seti
x <- c(10, 20, 30, 40, 50)
y <- c(15, 25, 35, 45, 55)
# Kovaryansı hesapla
kovaryans <- cov(x, y)
# Sonucu yazdır
print(paste("x ve y değişkenleri arasındaki kovaryans:", kovaryans))
## [1] "x ve y değişkenleri arasındaki kovaryans: 250"
library(readr)
train <- read_csv("train.csv")
test=read_csv("test.csv")
train
## # A tibble: 8,693 × 14
## PassengerId HomePlanet CryoSleep Cabin Destination Age VIP RoomService
## <chr> <chr> <lgl> <chr> <chr> <dbl> <lgl> <dbl>
## 1 0001_01 Europa FALSE B/0/P TRAPPIST-1e 39 FALSE 0
## 2 0002_01 Earth FALSE F/0/S TRAPPIST-1e 24 FALSE 109
## 3 0003_01 Europa FALSE A/0/S TRAPPIST-1e 58 TRUE 43
## 4 0003_02 Europa FALSE A/0/S TRAPPIST-1e 33 FALSE 0
## 5 0004_01 Earth FALSE F/1/S TRAPPIST-1e 16 FALSE 303
## 6 0005_01 Earth FALSE F/0/P PSO J318.5-22 44 FALSE 0
## 7 0006_01 Earth FALSE F/2/S TRAPPIST-1e 26 FALSE 42
## 8 0006_02 Earth TRUE G/0/S TRAPPIST-1e 28 FALSE 0
## 9 0007_01 Earth FALSE F/3/S TRAPPIST-1e 35 FALSE 0
## 10 0008_01 Europa TRUE B/1/P 55 Cancri e 14 FALSE 0
## # ℹ 8,683 more rows
## # ℹ 6 more variables: FoodCourt <dbl>, ShoppingMall <dbl>, Spa <dbl>,
## # VRDeck <dbl>, Name <chr>, Transported <lgl>
Bu yarışmada göreviniz , Uzay Gemisi Titanik’in uzay-zaman anomalisiyle çarpışması sırasında bir yolcunun alternatif bir boyuta taşınıp taşınmadığını tahmin etmektir . Bu tahminleri yapmanıza yardımcı olmak için size geminin hasarlı bilgisayar sisteminden kurtarılan bir dizi kişisel kayıt veriliyor.
Dosya ve Veri Alanı Açıklamaları - train.csv - Yolcuların yaklaşık üçte ikisinin (~8700) kişisel kayıtları, eğitim verileri olarak kullanılacak.
PassengerId- Her yolcu için benzersiz bir Kimlik. Her kimlik, yolcunun birlikte seyahat ettiği grubu belirten ve grup içindeki numarası olan gggg_ppformu alır . Bir gruptaki insanlar çoğunlukla aile üyeleridir, ancak her zaman değil.ggggpp
HomePlanet- Yolcunun ayrıldığı gezegen, genellikle daimi ikamet ettikleri gezegen.
CryoSleep- Yolcunun yolculuk süresince askıya alınmış animasyona alınmayı seçip seçmediğini belirtir. Dondurucu uykudaki yolcular kabinlerine hapsedilir.
Cabin - Yolcunun kaldığı kabin numarası. Biçimi güverte/numara/taraf şeklindedir, taraf P (Port) için ya da S (Starboard) için olabilir..
Destination- Yolcunun ineceği gezegen.
Age- Yolcunun yaşı.
VIP- Yolcunun yolculuk sırasında özel VIP hizmeti için ödeme yapıp yapmadığı. RoomService, FoodCourt, ShoppingMall, Spa, VRDeck- Yolcunun Uzay Gemisi Titanic’in birçok lüks olanağının her birinde fatura ettiği tutar.
Name- Yolcunun adı ve soyadı.
Transported- Yolcunun başka bir boyuta taşınıp taşınmadığı. Bu hedeftir, tahmin etmeye çalıştığınız sütundur.
test.csv - Yolcuların geri kalan üçte birinin (~4300) kişisel kayıtları, test verisi olarak kullanılacak. TransportedGöreviniz bu setteki yolcular için değerini tahmin etmektir .
sample_submission.csv - Doğru formatta bir gönderim dosyası.
PassengerId- Test setindeki her yolcunun kimliği.
Transported- Hedef. Her yolcu için veya’dan birini tahmin Trueedin False.
library(tidyverse)
library(explore)
veri <- separate(train, Cabin, into = c("sutun1", "sutun2", "sutun3"), sep = "/", remove=FALSE)