Quarto
‘tidyverse’ paketlerini kurup yükleyerek başlayın.
Warning: package 'tidyverse' was built under R version 4.2.3
Warning: package 'ggplot2' was built under R version 4.2.3
Warning: package 'tibble' was built under R version 4.2.3
Warning: package 'tidyr' was built under R version 4.2.3
Warning: package 'readr' was built under R version 4.2.3
Warning: package 'purrr' was built under R version 4.2.3
Warning: package 'dplyr' was built under R version 4.2.3
Warning: package 'stringr' was built under R version 4.2.3
Warning: package 'forcats' was built under R version 4.2.3
Warning: package 'lubridate' was built under R version 4.2.3
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr 1.1.1 ✔ readr 2.1.4
✔ forcats 1.0.0 ✔ stringr 1.5.0
✔ ggplot2 3.4.2 ✔ tibble 3.2.1
✔ lubridate 1.9.2 ✔ tidyr 1.3.0
✔ purrr 1.0.1
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag() masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
“forestfires.csv” veri kümesini bir tibble olarak R’ye aktarın.
Rows: 517 Columns: 13
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (2): month, day
dbl (11): X, Y, FFMC, DMC, DC, ISI, temp, RH, wind, rain, area
ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Orman Yangını Verilerinin Önemi
Veri çerçevesini özetlemek veya önizlemek için farklı işlevler kullanın.
Verilere bir göz atın, her bir değişken ve yangın arasındaki ilişkileri düşünün.
# A tibble: 6 × 13
X Y month day FFMC DMC DC ISI temp RH wind rain area
<dbl> <dbl> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 7 5 mar fri 86.2 26.2 94.3 5.1 8.2 51 6.7 0 0
2 7 4 oct tue 90.6 35.4 669. 6.7 18 33 0.9 0 0
3 7 4 oct sat 90.6 43.7 687. 6.7 14.6 33 1.3 0 0
4 8 6 mar fri 91.7 33.3 77.5 9 8.3 97 4 0.2 0
5 8 6 mar sun 89.3 51.3 102. 9.6 11.4 99 1.8 0 0
6 8 6 aug sun 92.3 85.3 488 14.7 22.2 29 5.4 0 0
spc_tbl_ [517 × 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
$ X : num [1:517] 7 7 7 8 8 8 8 8 8 7 ...
$ Y : num [1:517] 5 4 4 6 6 6 6 6 6 5 ...
$ month: chr [1:517] "mar" "oct" "oct" "mar" ...
$ day : chr [1:517] "fri" "tue" "sat" "fri" ...
$ FFMC : num [1:517] 86.2 90.6 90.6 91.7 89.3 92.3 92.3 91.5 91 92.5 ...
$ DMC : num [1:517] 26.2 35.4 43.7 33.3 51.3 ...
$ DC : num [1:517] 94.3 669.1 686.9 77.5 102.2 ...
$ ISI : num [1:517] 5.1 6.7 6.7 9 9.6 14.7 8.5 10.7 7 7.1 ...
$ temp : num [1:517] 8.2 18 14.6 8.3 11.4 22.2 24.1 8 13.1 22.8 ...
$ RH : num [1:517] 51 33 33 97 99 29 27 86 63 40 ...
$ wind : num [1:517] 6.7 0.9 1.3 4 1.8 5.4 3.1 2.2 5.4 4 ...
$ rain : num [1:517] 0 0 0 0.2 0 0 0 0 0 0 ...
$ area : num [1:517] 0 0 0 0 0 0 0 0 0 0 ...
- attr(*, "spec")=
.. cols(
.. X = col_double(),
.. Y = col_double(),
.. month = col_character(),
.. day = col_character(),
.. FFMC = col_double(),
.. DMC = col_double(),
.. DC = col_double(),
.. ISI = col_double(),
.. temp = col_double(),
.. RH = col_double(),
.. wind = col_double(),
.. rain = col_double(),
.. area = col_double()
.. )
- attr(*, "problems")=<externalptr>
[1] "X" "Y" "month" "day" "FFMC" "DMC" "DC" "ISI" "temp"
[10] "RH" "wind" "rain" "area"
‘X’
‘Y’
‘month’
‘day’
‘FFMC’
‘DMC’
‘DC’
‘ISI’
‘temp’
‘RH’
‘wind’
‘rain’
‘area’
Sütunların aşağıdaki bilgilere karşılık geldiğini biliyoruz:
X: Montesinho park haritasındaki X ekseni uzamsal koordinatı: 1’den 9’a
Y: Montesinho park haritasında Y ekseni uzamsal koordinatı: 2 ila 9
month: Yılın ayı: “jan” - “dec”
day: Haftanın günü: ‘mon’ to ‘sun’
FFMC: FWI sisteminden İnce Yakıt Nem Kodu indeksi: 18,7 - 96,20
DMC:FWI sisteminden Duff Nem Kodu indeksi: 1,1 ila 291,3
DC: FWI sisteminden Kuraklık Kodu endeksi: 7,9 ila 860,6
ISI: FWI sisteminden İlk Yayılma Endeksi: 0,0 - 56,10
temp: Santigrat derece cinsinden sıcaklık: 2,2 - 33,30
RH: Yüzde cinsinden bağıl nem: 15,0 ila 100
wind: Km/sa cinsinden rüzgar hızı: 0,40 ila 9,40
rain: mm/m2 cinsinden dış yağmur: 0,0 - 6,4
area: Ormanın yanmış alanı (ha cinsinden): 0,00 - 1090,84
Sütunlardaki birçok faktör, örneğin yangınlara katkıda bulunabilir: ‘DMC’, ‘DC’, ‘temp’, ‘rüzgar’, ‘yağmur’. Hepsi ‘alan’ ile ilişkilendirilebilir.
Veri İşleme
month ve day karakter değişkenlerdir, ama onların doğasında var olan bir düzen olduğunu biliyoruz. Bu değişkenleri, çizdiğimizde doğru sırada sıralanmaları için faktörlere dönüştüreceğiz.
[1] "mar" "oct" "aug" "sep" "apr" "jun" "jul" "feb" "jan" "dec" "may" "nov"
[1] "fri" "tue" "sat" "sun" "mon" "wed" "thu"
‘mar’
‘oct’
‘aug’
‘sep’
‘apr’
‘jun’
‘jul’
‘feb’
‘jan’
‘dec’
‘may’
‘nov’
‘fri’
‘tue’
‘sat’
‘sun’
‘mon’
‘wed’
‘thu’
Orman Yangınları En Çok Ne Zaman Oluşur?
Her ay çıkan yangın sayısını sayan bir özet bilgi oluşturun. Ardından bunu görselleştirme için kullanın, aynısı “gün” için de geçerlidir.
Ay Seviyesi
Ağustos ve Eylül aylarında yangınlarda büyük bir artış ve Mart ayında daha küçük bir artış görüyoruz. Yangınlar hafta içinde daha sık görünüyor
Zamana Karşı Diğer Değişkenleri Çizmek
month ile farklı değişkenler arasındaki ilişkiyi gösteren bazı görselleştirmeler oluşturun.
Görselleştirmelerden de anlayabileceğimiz gibi ‘DC’, ‘DMC’, ‘rain’, ‘temp’ değişkenlerinin yangınların ani artışıyla ilgisi var. Her bir değişkenin ne anlama geldiğini anlarsak, daha yüksek sıcaklık, havadaki daha az nem, aynı havanın daha kuru olması ve daha az yağmurun orman yangınına neden olmayı kolaylaştırması mantıklı olacaktır.
Orman Yangın Şiddetinin İncelenmesi
Bu veri setinde ‘area’ değişkeni, orman yangını sırasında yanan ormanın hektar sayısına ilişkin verileri içerir. Bu değişkeni yangının ciddiyetinin bir göstergesi olarak kullanacağız.
Her biri arasındaki ilişkiyi görüntüleyen görselleştirme oluşturun
Görselleştirmeden, orman yangınlarını yakalamayı kolaylaştıran değişkenin genellikle yangının ciddiyeti ile de ilgisi olduğunu fark etmek o kadar da zor değil.
Aykırı Değer Problemleri
Değişkenler arasındaki ilişkileri daha net bir şekilde görselleştirmek için ‘area’ belirli bir aralıkla sınırlayarak veri çerçevesini filtreleyin.
Verileri filtreledikten sonra, farklı değişkenler ile orman yangını alanı arasındaki ilişkileri gösteren daha net bir görselleştirme sağlar.