library(mosaicCalc)
## Loading required package: mosaic
## Registered S3 method overwritten by 'mosaic':
##   method                           from   
##   fortify.SpatialPolygonsDataFrame ggplot2
## 
## The 'mosaic' package masks several functions from core packages in order to add 
## additional features.  The original behavior of these functions should not be affected by this.
## 
## Attaching package: 'mosaic'
## The following objects are masked from 'package:dplyr':
## 
##     count, do, tally
## The following object is masked from 'package:Matrix':
## 
##     mean
## The following object is masked from 'package:ggplot2':
## 
##     stat
## The following objects are masked from 'package:stats':
## 
##     binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
##     quantile, sd, t.test, var
## The following objects are masked from 'package:base':
## 
##     max, mean, min, prod, range, sample, sum
## Loading required package: mosaicCore
## 
## Attaching package: 'mosaicCore'
## The following objects are masked from 'package:dplyr':
## 
##     count, tally
## The legacy packages maptools, rgdal, and rgeos, underpinning the sp package,
## which was just loaded, will retire in October 2023.
## Please refer to R-spatial evolution reports for details, especially
## https://r-spatial.org/r/2023/05/15/evolution4.html.
## It may be desirable to make the sf package available;
## package maintainers should consider adding sf to Suggests:.
## The sp package is now running under evolution status 2
##      (status 2 uses the sf package in place of rgdal)
## 
## Attaching package: 'mosaicCalc'
## The following object is masked from 'package:stats':
## 
##     D

##Data dan grafik data

Pada bab atau artikel kali ini kita akan membahas dan memperkenalkan beberapa dasar pra-kalkulus dalam bekerja dengan data yang akan kita gunakan secara luas di Blok Kalkulus MOSAIC.

  1. Bingkai Data Banyak orang menemukan data dalam bentuk tabel cetak, seperti Bill of Mortality tahun 1665 yang ditunjukkan di bawah ini. Tabel-tabel ini dirancang agar mudah dibaca oleh manusia dan kompak saat dicetak. Meskipun sudah lebih dari 350 tahun sejak diterbitkan, orang yang terpelajar masih dapat memahami isi tabel tersebut. Namun, volume data telah meledak hingga melebihi kemampuan untuk dicetak. Sebagai gantinya, data saat ini disimpan dan diakses secara elektronik. Namun, proses akses data ini masih didasarkan pada notasi “tabel”, meskipun tabel mengikuti serangkaian prinsip yang ketat. Kami akan menyebut tabel ini sebagai bingkai data dan penting bagi Anda untuk mempelajari beberapa prinsip inti pengorganisasian data. Setiap kolom tabel modern disebut variabel . Jadi ada variabel “terkubur” yang berisi jumlah orang yang dikuburkan dan variabel lain “wabah” yang memuat jumlah orang yang meninggal karena wabah. Tiap baris tabel disebut case , namun sering kali yang digunakan hanya baris saja. Untuk setiap meja, semua kasusnya sama, misalnya di sini, sebuah paroki.

  2. Mengakses tabel data

database relasional . (“Relasi” adalah kata lain dari “tabel”, sama seperti fungsi yang menjelaskan hubungan antara input dan output.)

Perselisihan data adalah istilah yang digunakan untuk menggambarkan pengerjaan dan ringkasan data.

contoh:

Engines
## # A tibble: 39 × 9
##    Engine           mass ncylinder strokes displacement  bore stroke   BHP   RPM
##    <chr>           <dbl>     <dbl>   <dbl>        <dbl> <dbl>  <dbl> <dbl> <dbl>
##  1 Webra Speedy    0.135         1       2          1.8  13.5   12.5  0.45 22000
##  2 Motori Cipolla  0.15          1       2          2.5  15     14    1    26000
##  3 Webra Speed 20  0.25          1       2          3.4  16.5   16    0.78 22000
##  4 Webra 40        0.27          1       2          6.5  21     19    0.96 15500
##  5 Webra 61 Black… 0.43          1       2         10    24     22    1.55 14000
##  6 Webra 6WR       0.49          1       2         10    24     22    2.76 19000
##  7 Enya 60-4C      0.61          1       4         10    24     22    0.84 11800
##  8 Webra 91RC      0.67          1       2         14.3  27     25    2.85 13000
##  9 Technopower ra… 0.913         7       4         20    15.9   14    0.82  8700
## 10 Webra T4        0.93          1       4         14.7  27     25    1.43  9300
## # ℹ 29 more rows
  1. Nama Variabel

untuk kerangka data yang akan kita gunakan, tersedia melalui dokumentasi R. Untuk memunculkan dokumentasi Engines, misalnya, berikan perintah:

Engines
## # A tibble: 39 × 9
##    Engine           mass ncylinder strokes displacement  bore stroke   BHP   RPM
##    <chr>           <dbl>     <dbl>   <dbl>        <dbl> <dbl>  <dbl> <dbl> <dbl>
##  1 Webra Speedy    0.135         1       2          1.8  13.5   12.5  0.45 22000
##  2 Motori Cipolla  0.15          1       2          2.5  15     14    1    26000
##  3 Webra Speed 20  0.25          1       2          3.4  16.5   16    0.78 22000
##  4 Webra 40        0.27          1       2          6.5  21     19    0.96 15500
##  5 Webra 61 Black… 0.43          1       2         10    24     22    1.55 14000
##  6 Webra 6WR       0.49          1       2         10    24     22    2.76 19000
##  7 Enya 60-4C      0.61          1       4         10    24     22    0.84 11800
##  8 Webra 91RC      0.67          1       2         14.3  27     25    2.85 13000
##  9 Technopower ra… 0.913         7       4         20    15.9   14    0.82  8700
## 10 Webra T4        0.93          1       4         14.7  27     25    1.43  9300
## # ℹ 29 more rows
names(Engines)
## [1] "Engine"       "mass"         "ncylinder"    "strokes"      "displacement"
## [6] "bore"         "stroke"       "BHP"          "RPM"
head(Engines)
## # A tibble: 6 × 9
##   Engine            mass ncylinder strokes displacement  bore stroke   BHP   RPM
##   <chr>            <dbl>     <dbl>   <dbl>        <dbl> <dbl>  <dbl> <dbl> <dbl>
## 1 Webra Speedy     0.135         1       2          1.8  13.5   12.5  0.45 22000
## 2 Motori Cipolla   0.15          1       2          2.5  15     14    1    26000
## 3 Webra Speed 20   0.25          1       2          3.4  16.5   16    0.78 22000
## 4 Webra 40         0.27          1       2          6.5  21     19    0.96 15500
## 5 Webra 61 Blackh… 0.43          1       2         10    24     22    1.55 14000
## 6 Webra 6WR        0.49          1       2         10    24     22    2.76 19000
nrow(Engines)
## [1] 39

perintah dibawah ini berguna untuk menampilkan data lengkap

View(Engines)
  1. Merencanakan Data

Kami akan menggunakan satu format grafis saja untuk menampilkan data, yaitu plot titik. Dalam plot titik, juga dikenal sebagai “plot sebar”, dua variabel ditampilkan, satu pada setiap sumbu grafis. Setiap kasus direpresentasikan sebagai sebuah titik, dengan koordinat horizontal dan vertikal yang mewakili nilai variabel untuk kasus tersebut.

contoh:

stroke <- fitModel(stroke ~ A*bore^b, data = Engines)
gf_point(stroke ~ bore, data = Engines) %>%
  slice_plot(stroke(bore) ~ bore, color="blue")

Lapisan kedua dibuat dengan slice_plot()perintah biasa. Untuk menempatkannya di atas plot titik kita menghubungkan dua perintah dengan sedikit tanda baca yang disebut “pipa”: %>%.