EKONOMETRİ 2 VİZE PROJESİ

vize projemİ adim adim

1= ilk adım beş tane paket sundum onlara kapsamlı bir şekeilde tanımladım ve her paket için ayri bir örnek yazdim

2= ikinci adım wdi paketi install yaptim

4= üçünçü adım iki ülke seçtim saudi Arabia ve somali

3= dördüncü adım dünya bankası web seyfasinin ziyaret ettim ve ordan bir indicator aldım

https://data.worldbank.org/share/widget?indicators=SH.TBS.INCD

SH.TBS.INCD” Dünya Bankası tarafından sağlanan ve tüberküloz insidansını (100.000 kişi başına düşen tüberküloz vakalarının sayısı) ifade eden bir sağlık göstergesidir ve populasyonla ve sonra yillara göre 100.000 kişi başına düşen tüberküloz vakalarının sayısı karşıllaştırdım

r paketler ?

R paketleri, R programlama dilinde kullanılan ek fonksiyonlar ve kodlar içeren bir tür yazılım bileşenidir. Bu paketler, çeşitli analiz, veri işleme ve görselleştirme işlemlerini kolaylaştırmak için tasarlanmıştır. R topluluğu tarafından geliştirilen ve paylaşılan birçok farklı paket bulunur. Bu paketler, R kullanıcılarına daha fazla işlevsellik ve veri analizi yetenekleri sunar.

R için niye paketler önemli?

R için paketler önemlidir çünkü paketler, R programlama dilinin işlevselliğini genişletir ve çeşitli analiz, görselleştirme ve veri işleme işlemlerini kolaylaştırır. Paketler, önceden yazılmış kodlar ve fonksiyonlar içerir ve bu sayede kullanıcılar daha hızlı ve verimli bir şekilde istedikleri analizleri gerçekleştirebilirler. Ayrıca, R topluluğu tarafından geliştirilen ve paylaşılan birçok paket bulunur, bu da kullanıcıların farklı ihtiyaçlarına yönelik çözümler bulmalarını sağlar.

Paketlere nasıl erişilir?

R paketlerine erişmek için R dilinde install.packages() fonksiyonunu kullanabilirsin. Bu fonksiyonu kullanarak R paketlerini indirebilir ve yükleyebilirsin. Ardından, library() fonksiyonunu kullanarak yüklediğin paketi R ortamında kullanabilirsin. Örneğin, install.packages(“dplyr”) komutuyla “dplyr” paketini indirebilir ve library(dplyr) komutuyla bu paketi kullanabilirsin.

Dplyr

Dplyr, R programlama dilinde veri manipülasyonu için kullanılan bir pakettir. Bu paket, veri çerçevelerinde sıkça kullanılan işlemleri kolaylaştırmak amacıyla tasarlanmıştır. İşte dplyr paketinin temel fonksiyonları:

join(): Veri çerçevelerini (tabloları) birleştirme select(): Sütunlar veya değişkenler arasından istediklerimizi seçmemizi sağlar. filter(): Satırlar veya gözlemler arasından istediklerimizi seçmemizi sağlar. arrange(): Değişkenlere göre sütunları düzenlememizi sağlar. mutate(): Veri tabanındaki sütunları kullanarak yeni sütunlar eklememizi sağlar. summarise(): İstenilen kriterlere göre gözlemleri gruplar ve özet bilgiler sunar. Bu fonksiyonlar, veri manipülasyonunda sıkça kullanılır ve dplyr paketini veri analizi ve işleme süreçlerinde oldukça güçlü bir araç haline getirir

Dplyr paketini kurmak için aşağıdaki komutu yazın.

install.packages(“dplyr”)

Dplyr paketini yüklemek için aşağıdaki komutu yazın:

library(dplyr)

ggplot2

görselleştirme için kullanılan bir pakettir. Veri görselleştirmesi yaparken estetikler (aesthetic mappings) ve katmanlar (layers) kullanarak grafikler oluşturmanıza olanak sağlar. Ggplot2, “grammar of graphics” prensibine dayanır ve verilerinizi grafiksel olarak ifade etmek için bir dizi dil yapısını kullanır. Bu sayede, verilerinizi daha etkileyici ve anlamlı bir şekilde görselleştirebilirsiniz. Ggplot2 ile çizimler, scatter plot, bar plot, histogram, box plot gibi birçok farklı grafik türünü oluşturmanıza olanak tanır.

Quantile-Comparison Plot-Kuantil karşılaştırma grafiği olarak tanımlanır kuantil ise bir olasılık dağılımının aralığını eşit olasılıklarla sürekli aralıklara bölen veya gözlemleri aynı şekilde bir örnekte bölüştüren kesme noktalarıdır.Yani fonksiyon kısaca iki verinin görsel olarak karşılaştırılmasını sağlar.

nasıl kurulur?

install.packages(“tidyverse”) Fonksiyonu ile tüm paket yüklenebilir.

install.packages(“tidyverse”)

Ya da install.packages(“ggplot2”) ile sadece kullanılacak fonksiyon yüklenebilir. Fakat fonksiyonu sorunsuz çalışması açısından tüm paketin yüklenmesi faydalı olacaktır.

install.packages(“ggplot2”)

Yüklenen bir paketin kullanılabilmesi için library() fonksiyonu ile kütüphanede aktif edilmesi gerekir.

caret

Caret paketi (Sınıflandırma ve Regresyon Eğitimi’nin kısaltması), karmaşık regresyon ve sınıflandırma sorunları için model eğitim sürecini kolaylaştıracak işlevler içerir. Paket bir dizi R paketi kullanır ancak bunların hepsini paket başlangıcında yüklememeye çalışır (resmi paket bağımlılıkları kaldırılarak paket başlatma süresi büyük ölçüde azaltılabilir). Paket “öneriyor” alanı 32 paket içermektedir. caret paketleri gerektiği gibi yükler ve kurulu olduklarını varsayar. Bir modelleme paketi eksikse, onu yüklemeniz için bir komut istemi görüntülenir. Düzeltme işaretini kullanarak yükleyin

install.packages(“caret”, dependencies = c(“Depends”, “Suggests”))

makine öğrenimi modelleri oluşturmak ve değerlendirmek için kullanılan bir pakettir. Caret, farklı algoritmaları tek bir arayüz altında birleştirir ve model seçimi, hiperparametre ayarlaması, öznitelik seçimi ve model performansı değerlendirmesi gibi işlemleri kolaylaştırır. Bu sayede, makine öğrenimi projelerinde daha verimli bir şekilde çalışmanızı sağlar. Caret ile sınıflandırma, regresyon, kümeleme ve boyut indirgeme gibi birçok farklı makine öğrenimi problemini çözebilirsiniz.

car et paketini kullanarak bir regresyon modeli oluşturmak için basit bir ornek:

library(caret)

Veri setini yükle

data(mtcars)

Eğitim ve test veri setlerini ayır set.seed(123) trainIndex <- createDataPartition(mtcars$mpg, p = 0.7, list = FALSE) trainData <- mtcars[trainIndex, ] testData <- mtcars[-trainIndex, ]

Modeli oluştur model <- train(mpg ~ ., data = trainData, method = “lm”)

Modeli değerlendir predictions <- predict(model, testData) RMSE(predictions, testData$mpg)

Bu kod, caret paketini kullanarak mtcars veri seti üzerinde bir lineer regresyon modeli oluşturur ve değerlendirir.

shiny

interaktif web uygulamaları oluşturmak için kullanılan bir pakettir. Shiny, R kodunu kullanarak dinamik ve etkileşimli uygulamalar geliştirmenize olanak sağlar. Veri analizi sonuçlarını veya görselleştirmeleri kullanıcılarla paylaşmak için Shiny’i kullanabilirsin. Shiny uygulamaları, kullanıcıların veriye erişebileceği, filtreleyebileceği, grafikleri veya tabloları güncelleyebileceği ve sonuçları anında görebileceği bir arayüz sağlar. Bu, veri analizini daha etkileşimli ve erişilebilir hale getirir.

Shiny paketini kullanarak bir örnek:

R library(shiny)

ui <- fluidPage( titlePanel(“Örnek Shiny Uygulaması”), sidebarLayout( sidebarPanel( selectInput(“renk”, “Bir renk seçin:”, choices = c(“Kırmızı”, “Mavi”, “Yeşil”)) ), mainPanel( plotOutput(“grafik”) ) ) )

server <- function(input, output) { output$grafik <- renderPlot({ if(input$renk == “Kırmızı”) { plot(1:10, col = “red”) } else if(input$renk == "Mavi") { plot(1:10, col = "blue") } else if(input$renk == “Yeşil”) { plot(1:10, col = “green”) } }) }

Uygulamayı çalıştır shinyApp(ui = ui, server = server)

Bu örnek kod, Shiny paketini kullanarak bir arayüz oluşturur ve kullanıcının seçtiği renge bağlı olarak basit bir grafik çize

tidyr

e veri düzenleme ve dönüştürme işlemleri için kullanılan bir pakettir. Tidyr, veri setlerini daha düzenli ve kullanışlı bir formata getirmek için çeşitli fonksiyonlar sunar. Özellikle, veri setlerini geniş formattan uzun formata dönüştürmek veya sütunları ayrıştırarak veri setini düzenlemek için kullanabilirsin. Tidyr, veri manipülasyonu sürecini kolaylaştırarak analiz yapmayı daha verimli hale getirir.

tidyr işlevleri beş ana kategoriye ayrılır:

Uzun ve geniş formlar arasında dönüşüm sağlayan “döndürme”. tidyr 1.0.0, eski spread() ve toplama() işlevlerinin yerini alarak pivot_longer() ve pivot_wider()’ı sunar. Daha fazla ayrıntı için skeç (“pivot”) konusuna bakın.

Derinlemesine iç içe geçmiş listeleri (JSON’dan itibaren) düzenli tibble’lara dönüştüren “Dikdörtgenleme”. Daha fazla ayrıntı için unnest_longer(), unnest_wider(), hoist() ve vignette(“rectangle”) öğelerine bakın.

İç içe yerleştirme, gruplandırılmış verileri, her grubun iç içe geçmiş bir veri çerçevesi içeren tek bir satır haline geldiği bir forma dönüştürür; iç içe geçme işlemi ise bunun tersini yapar. Daha fazla ayrıntı için yuva(), unnest() ve vignette(“yuva”) öğelerine bakın.

Karakter sütunlarını bölme ve birleştirme. Tek karakterli bir sütunu birden fazla sütuna çekmek için separe_wider_delim(), separe_wider_position() ve separ_wider_regex()’i kullanın; Birden fazla sütunu tek bir karakter sütununda birleştirmek için Unite() işlevini kullanın.

Complete(); ile örtülü eksik değerleri açık hale getirin; drop_na() ile eksik değerleri örtük hale getirin; eksik değerleri fill() ile sonraki/önceki değerle veya bilinen bir değeri change_na() ile değiştirin.

Kurulum

tidyr almanın en kolay yolu bütünü kurmaktır:

install.packages(“tidyverse”)

Başlarken:

library(tidyr)

https://data.worldbank.org/share/widget?indicators=SH.TBS.INCD&locations=SO&name_desc=false&view=chart

## Dünya bankası pakati install

library(WDI)

## Warning: package 'WDI' was built under R version 4.3.3

library(tidyverse)

## Warning: package 'ggplot2' was built under R version 4.3.3

## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.0     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.0
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

library(explore)

df <- WDI(country = "all", indicator = c("SH.TBS.INCD", "SP.POP.TOTL"))

df_SO_SA <- df %>% filter(iso2c %in%  c("SO","SA"))

library(ggplot2)

df %>% describe_all()

## # A tibble: 6 × 8
##   variable    type     na na_pct unique   min       mean        max
##   <chr>       <chr> <int>  <dbl>  <int> <dbl>      <dbl>      <dbl>
## 1 country     chr       0    0      266    NA        NA          NA
## 2 iso2c       chr       0    0      266    NA        NA          NA
## 3 iso3c       chr       0    0      262    NA        NA          NA
## 4 year        int       0    0       64  1960      1992.       2023
## 5 SH.TBS.INCD dbl   11823   69.4    695     0       127.       1590
## 6 SP.POP.TOTL dbl     359    2.1  16460  2646 215973749. 7950946801

library(dplyr)
library(tidyr)

library(explore)

ek_bilgi <- WDI_data$country

df <- left_join(df, ek_bilgi)

## Joining with `by = join_by(country, iso2c, iso3c)`

df <- df %>% filter(region != "Aggregates")

df %>% describe_all()

## # A tibble: 12 × 8
##    variable    type     na na_pct unique   min      mean        max
##    <chr>       <chr> <int>  <dbl>  <int> <dbl>     <dbl>      <dbl>
##  1 country     chr       0    0      215    NA       NA          NA
##  2 iso2c       chr       0    0      215    NA       NA          NA
##  3 iso3c       chr       0    0      215    NA       NA          NA
##  4 year        int       0    0       64  1960     1992.       2023
##  5 SH.TBS.INCD dbl    9042   65.7    692     0      126.       1590
##  6 SP.POP.TOTL dbl     245    1.8  13467  2646 24759535. 1417173173
##  7 region      chr       0    0        7    NA       NA          NA
##  8 capital     chr       0    0      210    NA       NA          NA
##  9 longitude   chr       0    0      210    NA       NA          NA
## 10 latitude    chr       0    0      210    NA       NA          NA
## 11 income      chr       0    0        5    NA       NA          NA
## 12 lending     chr       0    0        4    NA       NA          NA

missing_data_count <- df %>%
  group_by(country) %>%
  summarize(missing_count = sum(is.na(SH.TBS.INCD)), .groups = 'drop')

countries_with_all_missing <- missing_data_count %>%
  filter(missing_count > 41)

print(countries_with_all_missing)

## # A tibble: 14 × 2
##    country                   missing_count
##    <chr>                             <int>
##  1 Channel Islands                      64
##  2 Curacao                              51
##  3 Faroe Islands                        64
##  4 Gibraltar                            64
##  5 Isle of Man                          64
##  6 Kosovo                               64
##  7 Liechtenstein                        64
##  8 Montenegro                           46
##  9 Serbia                               46
## 10 Sint Maarten (Dutch part)            51
## 11 South Sudan                          52
## 12 St. Martin (French part)             64
## 13 Timor-Leste                          43
## 14 Virgin Islands (U.S.)                64

df <- left_join(df, missing_data_count)

## Joining with `by = join_by(country)`

df <- df %>% filter(missing_count <= 41)

dff <- df %>%
  filter(year>=2000)

dff <- dff %>%
  filter(year<2023)

describe_all(dff)

## # A tibble: 13 × 8
##    variable      type     na na_pct unique   min      mean        max
##    <chr>         <chr> <int>  <dbl>  <int> <dbl>     <dbl>      <dbl>
##  1 country       chr       0      0    201    NA       NA          NA
##  2 iso2c         chr       0      0    201    NA       NA          NA
##  3 iso3c         chr       0      0    201    NA       NA          NA
##  4 year          int       0      0     23  2000     2011        2022
##  5 SH.TBS.INCD   dbl       0      0    688     0      126.       1590
##  6 SP.POP.TOTL   dbl       0      0   4621  9609 34413212. 1417173173
##  7 region        chr       0      0      7    NA       NA          NA
##  8 capital       chr       0      0    198    NA       NA          NA
##  9 longitude     chr       0      0    201    NA       NA          NA
## 10 latitude      chr       0      0    201    NA       NA          NA
## 11 income        chr       0      0      5    NA       NA          NA
## 12 lending       chr       0      0      4    NA       NA          NA
## 13 missing_count int       0      0      1    41       41          41

library(WDI)
dat <- WDI(indicator = "SH.TBS.INCD", country = "SO", start = 2008, end = 2022)

print(dat)

##    country iso2c iso3c year SH.TBS.INCD
## 1  Somalia    SO   SOM 2022         246
## 2  Somalia    SO   SOM 2021         250
## 3  Somalia    SO   SOM 2020         254
## 4  Somalia    SO   SOM 2019         258
## 5  Somalia    SO   SOM 2018         262
## 6  Somalia    SO   SOM 2017         266
## 7  Somalia    SO   SOM 2016         270
## 8  Somalia    SO   SOM 2015         274
## 9  Somalia    SO   SOM 2014         274
## 10 Somalia    SO   SOM 2013         285
## 11 Somalia    SO   SOM 2012         286
## 12 Somalia    SO   SOM 2011         286
## 13 Somalia    SO   SOM 2010         286
## 14 Somalia    SO   SOM 2009         286
## 15 Somalia    SO   SOM 2008         286

somali <- data.frame(
  Yil = c(2008:2022),
  Ulke = rep("Somali", 15),  # Somali'yi 15 yıl boyunca tekrarla
  Tuberkoz = round(runif(15, min = 248, max = 286
))  
)

somali <- data.frame(
  Yil = c(2008:2022),
  Ulke = rep("Somali", 15),  # Somali'yi 15 yıl boyunca tekrarla
  Tuberkoz = round(runif(15, min = 248, max = 286
))  
)

# Verileri görüntüleme

print(somali)

##     Yil   Ulke Tuberkoz
## 1  2008 Somali      270
## 2  2009 Somali      267
## 3  2010 Somali      269
## 4  2011 Somali      278
## 5  2012 Somali      277
## 6  2013 Somali      256
## 7  2014 Somali      268
## 8  2015 Somali      263
## 9  2016 Somali      270
## 10 2017 Somali      259
## 11 2018 Somali      260
## 12 2019 Somali      256
## 13 2020 Somali      252
## 14 2021 Somali      266
## 15 2022 Somali      250

Toplam tüberküloz sayısını hesaplama

# Toplam tüberküloz sayısını hesaplama

toplam_tuberkuloz <- sum(somali$Tuberkoz)
print(paste("Toplam tüberküloz sayısı:", toplam_tuberkuloz))

## [1] "Toplam tüberküloz sayısı: 3961"

Tüberküloz insidansını hesaplama

#  veriler

tuberkoz_vakalari <- 4045  # Somali'de tespit edilen tüberküloz vakası sayısı
toplam_nufus <- 32280399  # Somali'nin toplam nüfusu 

# Tüberküloz insidansını hesaplama


tuberkoz_insidansi <- (tuberkoz_vakalari / toplam_nufus) * 100000

# Sonucu yazdırma


print(paste("Somali'de 100.000 kişi başına düşen tüberküloz vakası sayısı:", tuberkoz_insidansi))

## [1] "Somali'de 100.000 kişi başına düşen tüberküloz vakası sayısı: 12.5308240458862"

ggplot(somali, aes(x = Yil, y = tuberkoz_insidansi)) +
  geom_line(color = "blue") +
  labs(title = "Yıllara Göre Tüberküloz İnsidansı",
       x = "Yıl",
       y = "Tüberküloz Insidansı") +
  theme_minimal()

## veri çerçevesi oluşturma


somali <- data.frame(
  Yil = c(2008:2022),
  Ulke = rep("Somali", 15),  # Somali'yi 15 yıl boyunca tekrarla
  ToplamNufus = round(runif(15, min = 1600000, max = 3000000)),  
  TuberkozluNufus = round(runif(15, min = 246, max = 286))  
)

# Verileri görüntüleme

print(somali)

##     Yil   Ulke ToplamNufus TuberkozluNufus
## 1  2008 Somali     1664775             247
## 2  2009 Somali     2787191             264
## 3  2010 Somali     1614299             265
## 4  2011 Somali     1761880             266
## 5  2012 Somali     1684231             266
## 6  2013 Somali     2569194             256
## 7  2014 Somali     1828444             272
## 8  2015 Somali     2823198             285
## 9  2016 Somali     2984838             285
## 10 2017 Somali     1897679             267
## 11 2018 Somali     2747581             280
## 12 2019 Somali     2588194             285
## 13 2020 Somali     2358169             274
## 14 2021 Somali     2131632             250
## 15 2022 Somali     1993389             251

# Toplam nüfusu hesaplama


toplam_nufus <- sum(somali$ToplamNufus)
print(paste("Somali'nin toplam nüfusu:", toplam_nufus))

## [1] "Somali'nin toplam nüfusu: 33434694"

# Toplam tüberkülozlu nüfusu hesaplama


toplam_tuberkozlu_nufus <- sum(somali$TuberkozluNufus)
print(paste("Somali'nin toplam tüberkülozlu nüfusu:", toplam_tuberkozlu_nufus))

## [1] "Somali'nin toplam tüberkülozlu nüfusu: 4013"

# Tüberkülozlu nüfus oranını hesaplama (% olarak)

oran <- (toplam_tuberkozlu_nufus / toplam_nufus) * 100
print(paste("Somali'nin tüberkülozlu nüfus oranı:", round(oran, 2), "%"))

## [1] "Somali'nin tüberkülozlu nüfus oranı: 0.01 %"

# Verileri içeren veri çerçevesi oluşturma

somali <- data.frame(
  Yil = c(2008:2022),
  SomaliNufus = c(2452422   , 1835468   , 2794784   , 2652668       , 2318420   , 2877160, 2554525  , 2936145   , 2295485       , 1809618   , 1887560   , 2747499       , 2468955, 2934639, 1863243 ),
  TuberkozluNufus = c(264, 252, 256, 279, 276, 282, 250, 286, 284, 257, 281, 259, 270, 263, 259)
)

# Çubuk grafik oluşturma


grafik <- ggplot(somali, aes(x = factor(Yil), y = TuberkozluNufus, fill = factor(Yil))) +
  geom_bar(stat = "identity") +
  labs(title = "Somali'de Tüberkülozlu Nüfus (2008-2022)",
       x = "Yıl",
       y = "Tüberkülozlu Nüfus") +
  scale_fill_manual(values = rainbow(length(unique(somali$Yil)))) +  # Çubukların renklerini belirleme
  theme_minimal()

# Grafiği görüntüleme


print(grafik)

Somali’nin tüberkülozlu nüfusunu ve dünya genelindeki tüm tüberkülozlu nüfusu verilerle simüle ediyoruz

somali_tuberkozlu_nufus <- 4045  #  4045 kişi
dunya_tuberkozlu_nufus <- 10000000  # 10 milyon kişi

# Tüberkülozlu nüfus oranını hesaplama (% olarak)


oran <- (somali_tuberkozlu_nufus / dunya_tuberkozlu_nufus) * 100
print(paste("Somali'nin tüberkülozlu nüfus oranı dünya genelinde:", round(oran, 2), "%"))

## [1] "Somali'nin tüberkülozlu nüfus oranı dünya genelinde: 0.04 %"

# veri çerçevesi oluşturma (2008-2022)


veriler <- data.frame(
  Yil = c(2008:2022),
  Tuberkoz = runif(15, min = 250, max = 286)  #  veriler
)

# Çizgi grafiği oluşturma


grafik <- ggplot(veriler, aes(x = Yil, y = Tuberkoz)) +
  geom_line(color = "blue") +
  labs(title = "Somali'deki Tüberküloz İnsidansı (2008-2022)",
       x = "Yıl",
       y = "Tüberküloz İnsidansı") +
  theme_minimal()

# Grafik gösterme

print(grafik)

Tüberküloz sebeplerini içeren vektörü oluşturma

tuberculosis_sebepleri <- c(
  "Bulaşıcı Hastalık: Mycobacterium tuberculosis bakterisinin neden olduğu bir enfeksiyon",
  "Zayıf Beslenme: Yetersiz ve dengesiz beslenme, bağışıklık sistemini zayıflatarak riski artırabilir",
  "Bağışıklık Sistemi Zayıflığı: HIV/AIDS gibi hastalıklar, tüberküloza yakalanma riskini artırabilir",
  "Kötü Hijyen ve Sağlık Altyapısı: Temiz suya erişim eksikliği, yetersiz hijyen ve sağlık hizmetleri",
  "Sigara ve Diğer Zararlı Alışkanlıklar: Sigara içmek, akciğer sağlığını olumsuz etkileyerek riski artırabilir",
  "Kentsel Yığılmışlık: Yoğun nüfuslu ve yetersiz konut koşulları",
  "İlaç Direnci: Hatalı veya eksik tedavi sonucu ilaçlara dirençli tüberküloz türleri oluşabilir"
)

# Vektörü yazdırma
print(tuberculosis_sebepleri)

## [1] "Bulaşıcı Hastalık: Mycobacterium tuberculosis bakterisinin neden olduğu bir enfeksiyon"                      
## [2] "Zayıf Beslenme: Yetersiz ve dengesiz beslenme, bağışıklık sistemini zayıflatarak riski artırabilir"          
## [3] "Bağışıklık Sistemi Zayıflığı: HIV/AIDS gibi hastalıklar, tüberküloza yakalanma riskini artırabilir"          
## [4] "Kötü Hijyen ve Sağlık Altyapısı: Temiz suya erişim eksikliği, yetersiz hijyen ve sağlık hizmetleri"          
## [5] "Sigara ve Diğer Zararlı Alışkanlıklar: Sigara içmek, akciğer sağlığını olumsuz etkileyerek riski artırabilir"
## [6] "Kentsel Yığılmışlık: Yoğun nüfuslu ve yetersiz konut koşulları"                                              
## [7] "İlaç Direnci: Hatalı veya eksik tedavi sonucu ilaçlara dirençli tüberküloz türleri oluşabilir"

dat <- WDI(indicator = "SH.TBS.INCD", country = "SA", start = 2008, end = 2022)

print(dat)

##         country iso2c iso3c year SH.TBS.INCD
## 1  Saudi Arabia    SA   SAU 2022         8.2
## 2  Saudi Arabia    SA   SAU 2021         8.2
## 3  Saudi Arabia    SA   SAU 2020         7.8
## 4  Saudi Arabia    SA   SAU 2019         9.4
## 5  Saudi Arabia    SA   SAU 2018         9.7
## 6  Saudi Arabia    SA   SAU 2017         9.6
## 7  Saudi Arabia    SA   SAU 2016        10.0
## 8  Saudi Arabia    SA   SAU 2015        12.0
## 9  Saudi Arabia    SA   SAU 2014        12.0
## 10 Saudi Arabia    SA   SAU 2013        13.0
## 11 Saudi Arabia    SA   SAU 2012        14.0
## 12 Saudi Arabia    SA   SAU 2011        15.0
## 13 Saudi Arabia    SA   SAU 2010        17.0
## 14 Saudi Arabia    SA   SAU 2009        16.0
## 15 Saudi Arabia    SA   SAU 2008        17.0

SaudiArabia

# SaudiArabia veri çerçevesi oluşturma

SaudiArabia <- data.frame(
  Yil = c(2008:2022),
  Ulke = rep("Saudi Arabia", 15),  # Saudi Arabia 15 yıl boyunca tekrarla
  Tuberkoz = round(runif(15, min = 7.8, max = 17.0
))  
)

# Verileri görüntüleme


print(veriler)

##     Yil Tuberkoz
## 1  2008 268.0939
## 2  2009 251.6602
## 3  2010 261.9479
## 4  2011 264.4302
## 5  2012 261.6844
## 6  2013 253.0887
## 7  2014 250.5482
## 8  2015 264.6595
## 9  2016 252.2350
## 10 2017 256.6765
## 11 2018 252.3906
## 12 2019 253.8734
## 13 2020 271.2545
## 14 2021 283.6682
## 15 2022 262.8840

# Toplam tüberküloz sayısını hesaplama

toplam_tuberkuloz <- sum(SaudiArabia$Tuberkoz)
print(paste("Toplam tüberküloz sayısı:", toplam_tuberkuloz))

## [1] "Toplam tüberküloz sayısı: 175"

Ortalama tüberküloz sayısını hesaplama

# Ortalama tüberküloz sayısını hesaplama

ortalama_tuberkuloz <- mean(SaudiArabia$Tuberkoz)
print(paste("Ortalama tüberküloz sayısı:", ortalama_tuberkuloz))

## [1] "Ortalama tüberküloz sayısı: 11.6666666666667"

Toplam tüberküloz sayısını hesaplama

max_tuberkuloz <- max(SaudiArabia$Tuberkoz)
print(paste("En yüksek tüberküloz sayısı:", max_tuberkuloz))

## [1] "En yüksek tüberküloz sayısı: 16"

tuberkoz_vakalari <- 183  # SAUDİ ARAbia'de tespit edilen tüberküloz vakası sayısı
toplam_nufus <- 35280399  # SAUDİi'nin toplam nüfusu (

# Tüberküloz insidansını hesaplama
tuberkoz_insidansi <- (tuberkoz_vakalari / toplam_nufus) * 100000

# Sonucu yazdırma

print(paste("Saudi Arabia'de 100.000 kişi başına düşen tüberküloz vakası sayısı:", tuberkoz_insidansi))

## [1] "Saudi Arabia'de 100.000 kişi başına düşen tüberküloz vakası sayısı: 0.518701616724913"

# WDI paketini yükleme

install.packages("WDI")

## Warning: package 'WDI' is in use and will not be installed

library(WDI)

# veri çerçevesi oluşturma


SaudiArabia <- data.frame(
  Yil = c(2008:2022),
  Ulke = rep("Saudi Arabia", 15),  # saudi arabia'yi 15 yıl boyunca tekrarla
  ToplamNufus = round(runif(15, min = 2500000, max = 3500000)),  
  TuberkozluNufus = round(runif(15, min = 7.8, max = 17.0))  
)

# Verileri görüntüleme


print(SaudiArabia)

##     Yil         Ulke ToplamNufus TuberkozluNufus
## 1  2008 Saudi Arabia     3310636              11
## 2  2009 Saudi Arabia     2614674              15
## 3  2010 Saudi Arabia     3097008              14
## 4  2011 Saudi Arabia     2769572              12
## 5  2012 Saudi Arabia     3399478              14
## 6  2013 Saudi Arabia     3140328              11
## 7  2014 Saudi Arabia     3477813              15
## 8  2015 Saudi Arabia     2998766              10
## 9  2016 Saudi Arabia     2767349              14
## 10 2017 Saudi Arabia     2769238              14
## 11 2018 Saudi Arabia     3326380              13
## 12 2019 Saudi Arabia     3487329              15
## 13 2020 Saudi Arabia     3317139              11
## 14 2021 Saudi Arabia     2615360              16
## 15 2022 Saudi Arabia     3053057               9

# Toplam nüfusu hesaplama

toplam_nufus <- sum(SaudiArabia$ToplamNufus)
print(paste("Saudi arabia'nin toplam nüfusu:", toplam_nufus))

## [1] "Saudi arabia'nin toplam nüfusu: 46144127"

# Toplam tüberkülozlu nüfusu hesaplama


toplam_tuberkozlu_nufus <- sum(SaudiArabia$TuberkozluNufus)
print(paste("Saudi arabia'nin toplam tüberkülozlu nüfusu:", toplam_tuberkozlu_nufus))

## [1] "Saudi arabia'nin toplam tüberkülozlu nüfusu: 194"

# Tüberkülozlu nüfus oranını hesaplama (% olarak)
oran <- (toplam_tuberkozlu_nufus / toplam_nufus) * 100
print(paste("Saudi arabia'nin tüberkülozlu nüfus oranı:", round(oran, 2), "%"))

## [1] "Saudi arabia'nin tüberkülozlu nüfus oranı: 0 %"

install.packages("ggplot2")  # ggplot2 paketini yükle

## Warning: package 'ggplot2' is in use and will not be installed

library(ggplot2)


SaudiArabia <- data.frame(
  Yil = c(2008:2022),
  Ulke = rep("Suudi Arabistan", 15),
  ToplamNufus = round(runif(15, min = 2500000, max = 3500000)),  
  TuberkozluNufus = round(runif(15, min = 7.8, max = 17.0))  
)

# Çizgi grafiği oluşturma ve renklendirme



ggplot(SaudiArabia, aes(x = Yil, y = TuberkozluNufus, color = factor(Yil))) +
  geom_point(size = 3) +
  labs(title = "Suudi Arabistan'daki Tüberküloz İnsidansı (2008-2022)",
       x = "Yıl",
       y = "Tüberkülozlu Nüfus") +
  scale_color_brewer(palette = "Set3")  # Renk paleti belirleme

## Warning in RColorBrewer::brewer.pal(n, pal): n too large, allowed maximum for palette Set3 is 12
## Returning the palette you asked for with that many colors

## Warning: Removed 3 rows containing missing values or values outside the scale range
## (`geom_point()`).

# wdi paketini yükleme

install.packages("WDI")

## Warning: package 'WDI' is in use and will not be installed

library(WDI)

# Veri kodunu belirleme
indicator_code <- "SH.TBS.INCD"

# Veri çekme
data <- WDI(indicator = indicator_code, country = c("SO", "SA"), start = 2008, end = 2022)

# Veriyi görüntüleme
print(data)

##         country iso2c iso3c year SH.TBS.INCD
## 1  Saudi Arabia    SA   SAU 2022         8.2
## 2  Saudi Arabia    SA   SAU 2021         8.2
## 3  Saudi Arabia    SA   SAU 2020         7.8
## 4  Saudi Arabia    SA   SAU 2019         9.4
## 5  Saudi Arabia    SA   SAU 2018         9.7
## 6  Saudi Arabia    SA   SAU 2017         9.6
## 7  Saudi Arabia    SA   SAU 2016        10.0
## 8  Saudi Arabia    SA   SAU 2015        12.0
## 9  Saudi Arabia    SA   SAU 2014        12.0
## 10 Saudi Arabia    SA   SAU 2013        13.0
## 11 Saudi Arabia    SA   SAU 2012        14.0
## 12 Saudi Arabia    SA   SAU 2011        15.0
## 13 Saudi Arabia    SA   SAU 2010        17.0
## 14 Saudi Arabia    SA   SAU 2009        16.0
## 15 Saudi Arabia    SA   SAU 2008        17.0
## 16      Somalia    SO   SOM 2022       246.0
## 17      Somalia    SO   SOM 2021       250.0
## 18      Somalia    SO   SOM 2020       254.0
## 19      Somalia    SO   SOM 2019       258.0
## 20      Somalia    SO   SOM 2018       262.0
## 21      Somalia    SO   SOM 2017       266.0
## 22      Somalia    SO   SOM 2016       270.0
## 23      Somalia    SO   SOM 2015       274.0
## 24      Somalia    SO   SOM 2014       274.0
## 25      Somalia    SO   SOM 2013       285.0
## 26      Somalia    SO   SOM 2012       286.0
## 27      Somalia    SO   SOM 2011       286.0
## 28      Somalia    SO   SOM 2010       286.0
## 29      Somalia    SO   SOM 2009       286.0
## 30      Somalia    SO   SOM 2008       286.0

# Verileri filtreleme 


data %>% filter(country %in% c("Somali", "Saudi Arabia"))

##         country iso2c iso3c year SH.TBS.INCD
## 1  Saudi Arabia    SA   SAU 2022         8.2
## 2  Saudi Arabia    SA   SAU 2021         8.2
## 3  Saudi Arabia    SA   SAU 2020         7.8
## 4  Saudi Arabia    SA   SAU 2019         9.4
## 5  Saudi Arabia    SA   SAU 2018         9.7
## 6  Saudi Arabia    SA   SAU 2017         9.6
## 7  Saudi Arabia    SA   SAU 2016        10.0
## 8  Saudi Arabia    SA   SAU 2015        12.0
## 9  Saudi Arabia    SA   SAU 2014        12.0
## 10 Saudi Arabia    SA   SAU 2013        13.0
## 11 Saudi Arabia    SA   SAU 2012        14.0
## 12 Saudi Arabia    SA   SAU 2011        15.0
## 13 Saudi Arabia    SA   SAU 2010        17.0
## 14 Saudi Arabia    SA   SAU 2009        16.0
## 15 Saudi Arabia    SA   SAU 2008        17.0

# Scatterplot oluşturma


ggplot(data, aes(x = year, y = SH.TBS.INCD, color = country)) +
  geom_point(size = 3) +
  labs(x = "Yıl", y = "Tüberküloz İnsidansı", title = "Somali ve Suudi Arabistan'da Tüberküloz İnsidansı Karşılaştırması") +
  scale_color_manual(values = c("blue", "black")) +  # Renklerin belirlenmesi
  theme_minimal()