Teknoloji Otomasyon

GiriÅŸ

Teknoloji, insanların hayatlarını kolaylaştıran, işleri hızlandıran ve iletişimi güçlendiren araçların ve sistemlerin bilimsel ve mühendislik prensipleriyle geliştirilmiş kullanımıdır. Bilgi işleme, iletişim, veri saklama, analiz ve daha pek çok alanda teknoloji, insanlığın yaşamını büyük ölçüde etkilemiştir. Bilgisayarlar, internet, yapay zeka, robotlar gibi pek çok teknolojik gelişme günlük yaşamımızın bir parçası haline gelmiştir ve sürekli olarak yeni inovasyonlarla evrim geçirmektedir.

Formu Yazma

\[\pi= \frac{P_t-P_{t-1}}{P_{t-1}}\]

Standart sapma formu

\[ \sigma = \sqrt \frac {\Sigma^N_i (X_i-\bar{X})^2}{N} \]

Açıklama

Standart sapma, bir veri setinin ne kadar dağılım gösterdiğini ölçen bir istatistiksel ölçüdür. Bir veri setindeki her bir değerin ortalama değerden ne kadar uzak olduğunu belirler.

Standart sapma, her bir veri noktasının ortalama değerden olan farkının karelerinin toplamının, bu farkların sayıya (n) bölünmesinin ardından karekökünün alınmasıyla hesaplanır. Formülü şu şekildedir:

Burada:

.s-standart sapmayı temsil eder.

.n-veri setindeki toplam örnek sayısını ifade eder.

.xi-her bir örneği temsil eder.

.x-veri setinin ortalamasını ifade eder.

Standart sapma, veri setinin ne kadar homojen veya heterojen olduğunu gösterir. Küçük bir standart sapma, veri setinin ortalama değer etrafında yoğunlaştığını, büyük bir standart sapma ise veri setinin dağılımının daha yaygın olduğunu gösterir.

Örnek

Veri kümesi:

\[x_1, x_2, \ldots, x_n\]

Ortalama:

\[\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i\]

Varyans:

\[s^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2\]

Standart sapma:

\[s = \sqrt{s^2}\]

Çözüm

Veri grubu:

\[1, 7, 8, 9, 10, 13, 50\]

Ortalama:

\[\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i = \frac{1}{7} (1 + 7 + 8 + 9 + 10 + 13 + 50) = \frac{98}{7} = 14\]

Varyans:

\[s^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2 = \frac{1}{7} ((1-14)^2 + (7-14)^2 + (8-14)^2 + (9-14)^2 + (10-14)^2 + (13-14)^2 + (50-14)^2)\]

\[= \frac{1}{7} ((-13)^2 + (-7)^2 + (-6)^2 + (-5)^2 + (-4)^2 + (-1)^2 + (36)^2)\]

\[= \frac{1}{7} (169 + 49 + 36 + 25 + 16 + 1 + 1296) = \frac{2592}{7} \approx 370.2857\]

Standart sapma:

\[s = \sqrt{s^2} = \sqrt{\frac{2592}{7}} \approx \sqrt{370.2857} \approx 19.2383\]

Grafik

library(WDI)
## Warning: package 'WDI' was built under R version 4.3.3

warning: package ’WDI’was built under R version 4.3.2

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3

warning: package “ggplot2’was built under R version 4.3.2

turkey_inflation <- WDI(country = "TR", indicator = "FP.CPI.TOTL.ZG", start = 2000, end = 2023)
japan_inflation <- WDI(country = "JP", indicator = "FP.CPI.TOTL.ZG", start = 2000, end = 2022)
turkey_inflation_df <- data.frame(year = as.numeric(row.names(turkey_inflation)), inflation = turkey_inflation$FP.CPI.TOTL.ZG)

japan_inflation_df <- data.frame(year = as.numeric(row.names(japan_inflation)), inflation = japan_inflation$FP.CPI.TOTL.ZG)
ggplot() +
  geom_line(data = turkey_inflation_df, aes(x = year, y = inflation, color = "Turkey")) +
  geom_line(data = japan_inflation_df, aes(x = year, y = inflation, color = "Japan"))
## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_line()`).

Train ve Test set ne denektir arastiran ve açiklayin?

Trani ve test araştırma ve açıklaması

vers setins R’a yüklenek

library(readr)
## Warning: package 'readr' was built under R version 4.3.3
train <- read_csv("train.csv")
## Rows: 8693 Columns: 14
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (5): PassengerId, HomePlanet, Cabin, Destination, Name
## dbl (6): Age, RoomService, FoodCourt, ShoppingMall, Spa, VRDeck
## lgl (3): CryoSleep, VIP, Transported
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(train)
library(readr)
test <- read_csv("test.csv")
## Rows: 4277 Columns: 13
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (5): PassengerId, HomePlanet, Cabin, Destination, Name
## dbl (6): Age, RoomService, FoodCourt, ShoppingMall, Spa, VRDeck
## lgl (2): CryoSleep, VIP
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(test)
library(rmarkdown)
paged_table(train)
library(rmarkdown)
paged_table(test)
library(ggplot2)
library(tidyr)
## Warning: package 'tidyr' was built under R version 4.3.3
library(stringr)
## Warning: package 'stringr' was built under R version 4.3.3
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.3.3
## Warning: package 'tibble' was built under R version 4.3.3
## Warning: package 'purrr' was built under R version 4.3.3
## Warning: package 'dplyr' was built under R version 4.3.3
## Warning: package 'forcats' was built under R version 4.3.3
## Warning: package 'lubridate' was built under R version 4.3.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ purrr     1.0.2
## ✔ forcats   1.0.0     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(explore)
## Warning: package 'explore' was built under R version 4.3.3
train <- separate(train, PassengerId, into = c("group_id", "sequence_number"), sep = "_", remove = FALSE)
train <- separate(train, Cabin, into = c("sutun1", "sutun2", "sutun3"), sep = "/", remove=FALSE)
train%>% describe_all()
## # A tibble: 19 × 8
##    variable        type     na na_pct unique   min   mean   max
##    <chr>           <chr> <int>  <dbl>  <int> <dbl>  <dbl> <dbl>
##  1 PassengerId     chr       0    0     8693    NA  NA       NA
##  2 group_id        chr       0    0     6217    NA  NA       NA
##  3 sequence_number chr       0    0        8    NA  NA       NA
##  4 HomePlanet      chr     201    2.3      4    NA  NA       NA
##  5 CryoSleep       lgl     217    2.5      3     0   0.36     1
##  6 Cabin           chr     199    2.3   6561    NA  NA       NA
##  7 sutun1          chr     199    2.3      9    NA  NA       NA
##  8 sutun2          chr     199    2.3   1818    NA  NA       NA
##  9 sutun3          chr     199    2.3      3    NA  NA       NA
## 10 Destination     chr     182    2.1      4    NA  NA       NA
## 11 Age             dbl     179    2.1     81     0  28.8     79
## 12 VIP             lgl     203    2.3      3     0   0.02     1
## 13 RoomService     dbl     181    2.1   1274     0 225.   14327
## 14 FoodCourt       dbl     183    2.1   1508     0 458.   29813
## 15 ShoppingMall    dbl     208    2.4   1116     0 174.   23492
## 16 Spa             dbl     183    2.1   1328     0 311.   22408
## 17 VRDeck          dbl     188    2.2   1307     0 305.   24133
## 18 Name            chr     200    2.3   8474    NA  NA       NA
## 19 Transported     lgl       0    0        2     0   0.5      1

datayı incelemek için str kullanıyorum

str(train)
## tibble [8,693 × 19] (S3: tbl_df/tbl/data.frame)
##  $ PassengerId    : chr [1:8693] "0001_01" "0002_01" "0003_01" "0003_02" ...
##  $ group_id       : chr [1:8693] "0001" "0002" "0003" "0003" ...
##  $ sequence_number: chr [1:8693] "01" "01" "01" "02" ...
##  $ HomePlanet     : chr [1:8693] "Europa" "Earth" "Europa" "Europa" ...
##  $ CryoSleep      : logi [1:8693] FALSE FALSE FALSE FALSE FALSE FALSE ...
##  $ Cabin          : chr [1:8693] "B/0/P" "F/0/S" "A/0/S" "A/0/S" ...
##  $ sutun1         : chr [1:8693] "B" "F" "A" "A" ...
##  $ sutun2         : chr [1:8693] "0" "0" "0" "0" ...
##  $ sutun3         : chr [1:8693] "P" "S" "S" "S" ...
##  $ Destination    : chr [1:8693] "TRAPPIST-1e" "TRAPPIST-1e" "TRAPPIST-1e" "TRAPPIST-1e" ...
##  $ Age            : num [1:8693] 39 24 58 33 16 44 26 28 35 14 ...
##  $ VIP            : logi [1:8693] FALSE FALSE TRUE FALSE FALSE FALSE ...
##  $ RoomService    : num [1:8693] 0 109 43 0 303 0 42 0 0 0 ...
##  $ FoodCourt      : num [1:8693] 0 9 3576 1283 70 ...
##  $ ShoppingMall   : num [1:8693] 0 25 0 371 151 0 3 0 17 0 ...
##  $ Spa            : num [1:8693] 0 549 6715 3329 565 ...
##  $ VRDeck         : num [1:8693] 0 44 49 193 2 0 0 NA 0 0 ...
##  $ Name           : chr [1:8693] "Maham Ofracculy" "Juanna Vines" "Altark Susent" "Solam Susent" ...
##  $ Transported    : logi [1:8693] FALSE TRUE FALSE FALSE TRUE TRUE ...

Açıklama

Bu Projede, Uzay Gemisi Titanic’in uzay-zaman anormalliği ile çarpışması sırasında bir yolcunun alternatif bir boyuta taşınıp taşınmadığını tahmin etmektir. Bu tahminleri yapmanıza yardımcı olmak için, geminin hasar görmüş bilgisayar sisteminden kurtarılan bir dizi kişisel kayıt verilmiştir

Dosya ve Veri Alanı Açıklamaları - train.csv - Eğitim verisi olarak kullanılacak yaklaşık üçte ikisi (~8700) yolcunun kişisel kayıtları.

  • PassengerId - Her yolcu için benzersiz bir kimlik. Her kimlik, yolcunun seyahat ettiÄŸi bir grubu gösteren gggg ile baÅŸlar ve pp grup içindeki sırasını temsil eder. Bir gruptaki insanlar genellikle aile üyeleridir, ancak her zaman deÄŸil.
  • HomePlanet - Yolcunun hareket ettiÄŸi gezegen, genellikle kalıcı ikamet gezegenleri. CryoSleep - Yolcunun yolculuÄŸun süresi boyunca dondurulmuÅŸ animasyona alınıp alınmayacağını gösterir. CryoSleep’te olan yolcular kabinlerine kapatılmıştır.
  • Cabin - Yolcunun konakladığı kabin numarası. deck/num/side ÅŸeklinde alınır, burada side, Port için P veya Starboard için S olabilir.
  • Destination - Yolcunun ineceÄŸi gezegen.
  • Age - Yolcunun yaşı.
  • VIP - Yolcunun yolculuk sırasında özel VIP hizmeti için ödeme yapılıp yapılmadığını belirtir. RoomService, FoodCourt, ShoppingMall, Spa, VRDeck - Yolcunun Spaceship Titanic’in birçok lüks olanaklarında ne kadar fatura ödediÄŸi.
  • Name - Yolcunun adı ve soyadı.
  • Transported - Yolcunun baÅŸka bir boyuta taşınıp taşınmadığı. Bu, hedef, tahmin etmeye çalıştığınız sütun.
  • test.csv - Geri kalan üçte biri (~4300) yolcunun kiÅŸisel kayıtları, test verisi olarak kullanılacaktır. Göreviniz, bu setteki yolcular için Transported deÄŸerini tahmin etmektir.
  • sample_submission.csv - DoÄŸru formatta bir sunum dosyası.
  • PassengerId - Test setindeki her yolcu için kimlik.
  • Transported - Hedef. Her yolcu için, True veya False deÄŸerlerinden birini tahmin edin.
library(tidyverse)
library(explore)
train %>% describe_all()
## # A tibble: 19 × 8
##    variable        type     na na_pct unique   min   mean   max
##    <chr>           <chr> <int>  <dbl>  <int> <dbl>  <dbl> <dbl>
##  1 PassengerId     chr       0    0     8693    NA  NA       NA
##  2 group_id        chr       0    0     6217    NA  NA       NA
##  3 sequence_number chr       0    0        8    NA  NA       NA
##  4 HomePlanet      chr     201    2.3      4    NA  NA       NA
##  5 CryoSleep       lgl     217    2.5      3     0   0.36     1
##  6 Cabin           chr     199    2.3   6561    NA  NA       NA
##  7 sutun1          chr     199    2.3      9    NA  NA       NA
##  8 sutun2          chr     199    2.3   1818    NA  NA       NA
##  9 sutun3          chr     199    2.3      3    NA  NA       NA
## 10 Destination     chr     182    2.1      4    NA  NA       NA
## 11 Age             dbl     179    2.1     81     0  28.8     79
## 12 VIP             lgl     203    2.3      3     0   0.02     1
## 13 RoomService     dbl     181    2.1   1274     0 225.   14327
## 14 FoodCourt       dbl     183    2.1   1508     0 458.   29813
## 15 ShoppingMall    dbl     208    2.4   1116     0 174.   23492
## 16 Spa             dbl     183    2.1   1328     0 311.   22408
## 17 VRDeck          dbl     188    2.2   1307     0 305.   24133
## 18 Name            chr     200    2.3   8474    NA  NA       NA
## 19 Transported     lgl       0    0        2     0   0.5      1
unique(train$HomePlanet)
## [1] "Europa" "Earth"  "Mars"   NA
levels(train$HomePlanet)
## NULL
train$HomePlanet <- addNA(train$HomePlanet)
levels(train$HomePlanet)
## [1] "Earth"  "Europa" "Mars"   NA
levels(train$HomePlanet)[is.na(levels(train$HomePlanet))] <- "NA"
library(describer)
## Warning: package 'describer' was built under R version 4.3.3
## 
## Attaching package: 'describer'
## The following object is masked from 'package:explore':
## 
##     describe
summary(train)
##  PassengerId          group_id         sequence_number     HomePlanet  
##  Length:8693        Length:8693        Length:8693        Earth :4602  
##  Class :character   Class :character   Class :character   Europa:2131  
##  Mode  :character   Mode  :character   Mode  :character   Mars  :1759  
##                                                           NA    : 201  
##                                                                        
##                                                                        
##                                                                        
##  CryoSleep          Cabin              sutun1             sutun2         
##  Mode :logical   Length:8693        Length:8693        Length:8693       
##  FALSE:5439      Class :character   Class :character   Class :character  
##  TRUE :3037      Mode  :character   Mode  :character   Mode  :character  
##  NA's :217                                                               
##                                                                          
##                                                                          
##                                                                          
##     sutun3          Destination             Age           VIP         
##  Length:8693        Length:8693        Min.   : 0.00   Mode :logical  
##  Class :character   Class :character   1st Qu.:19.00   FALSE:8291     
##  Mode  :character   Mode  :character   Median :27.00   TRUE :199      
##                                        Mean   :28.83   NA's :203      
##                                        3rd Qu.:38.00                  
##                                        Max.   :79.00                  
##                                        NA's   :179                    
##   RoomService        FoodCourt        ShoppingMall          Spa         
##  Min.   :    0.0   Min.   :    0.0   Min.   :    0.0   Min.   :    0.0  
##  1st Qu.:    0.0   1st Qu.:    0.0   1st Qu.:    0.0   1st Qu.:    0.0  
##  Median :    0.0   Median :    0.0   Median :    0.0   Median :    0.0  
##  Mean   :  224.7   Mean   :  458.1   Mean   :  173.7   Mean   :  311.1  
##  3rd Qu.:   47.0   3rd Qu.:   76.0   3rd Qu.:   27.0   3rd Qu.:   59.0  
##  Max.   :14327.0   Max.   :29813.0   Max.   :23492.0   Max.   :22408.0  
##  NA's   :181       NA's   :183       NA's   :208       NA's   :183      
##      VRDeck            Name           Transported    
##  Min.   :    0.0   Length:8693        Mode :logical  
##  1st Qu.:    0.0   Class :character   FALSE:4315     
##  Median :    0.0   Mode  :character   TRUE :4378     
##  Mean   :  304.9                                     
##  3rd Qu.:   46.0                                     
##  Max.   :24133.0                                     
##  NA's   :188
train[train == ''] <-NA
summary(train)
##  PassengerId          group_id         sequence_number     HomePlanet  
##  Length:8693        Length:8693        Length:8693        Earth :4602  
##  Class :character   Class :character   Class :character   Europa:2131  
##  Mode  :character   Mode  :character   Mode  :character   Mars  :1759  
##                                                           NA    : 201  
##                                                                        
##                                                                        
##                                                                        
##  CryoSleep          Cabin              sutun1             sutun2         
##  Mode :logical   Length:8693        Length:8693        Length:8693       
##  FALSE:5439      Class :character   Class :character   Class :character  
##  TRUE :3037      Mode  :character   Mode  :character   Mode  :character  
##  NA's :217                                                               
##                                                                          
##                                                                          
##                                                                          
##     sutun3          Destination             Age           VIP         
##  Length:8693        Length:8693        Min.   : 0.00   Mode :logical  
##  Class :character   Class :character   1st Qu.:19.00   FALSE:8291     
##  Mode  :character   Mode  :character   Median :27.00   TRUE :199      
##                                        Mean   :28.83   NA's :203      
##                                        3rd Qu.:38.00                  
##                                        Max.   :79.00                  
##                                        NA's   :179                    
##   RoomService        FoodCourt        ShoppingMall          Spa         
##  Min.   :    0.0   Min.   :    0.0   Min.   :    0.0   Min.   :    0.0  
##  1st Qu.:    0.0   1st Qu.:    0.0   1st Qu.:    0.0   1st Qu.:    0.0  
##  Median :    0.0   Median :    0.0   Median :    0.0   Median :    0.0  
##  Mean   :  224.7   Mean   :  458.1   Mean   :  173.7   Mean   :  311.1  
##  3rd Qu.:   47.0   3rd Qu.:   76.0   3rd Qu.:   27.0   3rd Qu.:   59.0  
##  Max.   :14327.0   Max.   :29813.0   Max.   :23492.0   Max.   :22408.0  
##  NA's   :181       NA's   :183       NA's   :208       NA's   :183      
##      VRDeck            Name           Transported    
##  Min.   :    0.0   Length:8693        Mode :logical  
##  1st Qu.:    0.0   Class :character   FALSE:4315     
##  Median :    0.0   Mode  :character   TRUE :4378     
##  Mean   :  304.9                                     
##  3rd Qu.:   46.0                                     
##  Max.   :24133.0                                     
##  NA's   :188
train <- train %>% mutate_if(is.character,as.factor)
library(ggplot2)
ggplot(train, aes(RoomService)) +geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## Warning: Removed 181 rows containing non-finite outside the scale range
## (`stat_bin()`).

ggplot(train, aes(Age)) +geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## Warning: Removed 179 rows containing non-finite outside the scale range
## (`stat_bin()`).

ggplot(train, aes(Spa)) +geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## Warning: Removed 183 rows containing non-finite outside the scale range
## (`stat_bin()`).

summary(train)
##   PassengerId      group_id    sequence_number  HomePlanet   CryoSleep      
##  0001_01:   1   0984   :   8   01     :6217    Earth :4602   Mode :logical  
##  0002_01:   1   4005   :   8   02     :1412    Europa:2131   FALSE:5439     
##  0003_01:   1   4256   :   8   03     : 571    Mars  :1759   TRUE :3037     
##  0003_02:   1   4498   :   8   04     : 231    NA    : 201   NA's :217      
##  0004_01:   1   5133   :   8   05     : 128                                 
##  0005_01:   1   5756   :   8   06     :  75                                 
##  (Other):8687   (Other):8645   (Other):  59                                 
##      Cabin          sutun1         sutun2      sutun3            Destination  
##  G/734/S:   8   F      :2794   82     :  28   P   :4206   55 Cancri e  :1800  
##  B/11/S :   7   G      :2559   19     :  22   S   :4288   PSO J318.5-22: 796  
##  B/201/P:   7   E      : 876   86     :  22   NA's: 199   TRAPPIST-1e  :5915  
##  B/82/S :   7   B      : 779   176    :  21               NA's         : 182  
##  C/137/S:   7   C      : 747   56     :  21                                   
##  (Other):8458   (Other): 739   (Other):8380                                   
##  NA's   : 199   NA's   : 199   NA's   : 199                                   
##       Age           VIP           RoomService        FoodCourt      
##  Min.   : 0.00   Mode :logical   Min.   :    0.0   Min.   :    0.0  
##  1st Qu.:19.00   FALSE:8291      1st Qu.:    0.0   1st Qu.:    0.0  
##  Median :27.00   TRUE :199       Median :    0.0   Median :    0.0  
##  Mean   :28.83   NA's :203       Mean   :  224.7   Mean   :  458.1  
##  3rd Qu.:38.00                   3rd Qu.:   47.0   3rd Qu.:   76.0  
##  Max.   :79.00                   Max.   :14327.0   Max.   :29813.0  
##  NA's   :179                     NA's   :181       NA's   :183      
##   ShoppingMall          Spa              VRDeck       
##  Min.   :    0.0   Min.   :    0.0   Min.   :    0.0  
##  1st Qu.:    0.0   1st Qu.:    0.0   1st Qu.:    0.0  
##  Median :    0.0   Median :    0.0   Median :    0.0  
##  Mean   :  173.7   Mean   :  311.1   Mean   :  304.9  
##  3rd Qu.:   27.0   3rd Qu.:   59.0   3rd Qu.:   46.0  
##  Max.   :23492.0   Max.   :22408.0   Max.   :24133.0  
##  NA's   :208       NA's   :183       NA's   :188      
##                  Name      Transported    
##  Alraium Disivering:   2   Mode :logical  
##  Ankalik Nateansive:   2   FALSE:4315     
##  Anton Woody       :   2   TRUE :4378     
##  Apix Wala         :   2                  
##  Asch Stradick     :   2                  
##  (Other)           :8483                  
##  NA's              : 200
VIM::aggr(x= train, sotvars=T)