Teks bagian ini menjelaskan model carPrice1()dengan Umur dan Jarak Tempuh sebagai jumlah masukan dan harga (dalam USD) sebagai keluaran. Klaim dibuat bahwa harga dapat dilihat sebagai fungsi dari Agedan Mileage. Mari kita buat grafik itu lagi.
library(mosaicCalc)
## Loading required package: mosaic
## Registered S3 method overwritten by 'mosaic':
## method from
## fortify.SpatialPolygonsDataFrame ggplot2
##
## The 'mosaic' package masks several functions from core packages in order to add
## additional features. The original behavior of these functions should not be affected by this.
##
## Attaching package: 'mosaic'
## The following objects are masked from 'package:dplyr':
##
## count, do, tally
## The following object is masked from 'package:Matrix':
##
## mean
## The following object is masked from 'package:ggplot2':
##
## stat
## The following objects are masked from 'package:stats':
##
## binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
## quantile, sd, t.test, var
## The following objects are masked from 'package:base':
##
## max, mean, min, prod, range, sample, sum
## Loading required package: mosaicCore
##
## Attaching package: 'mosaicCore'
## The following objects are masked from 'package:dplyr':
##
## count, tally
##
## Attaching package: 'mosaicCalc'
## The following object is masked from 'package:stats':
##
## D
Hondas <- read.csv("http://www.mosaic-web.org/go/datasets/used-hondas.csv")
head(Hondas)
## Price Year Mileage Location Color Age
## 1 20746 2006 18394 St.Paul Grey 1
## 2 19787 2007 8 St.Paul Black 0
## 3 17987 2005 39998 St.Paul Grey 2
## 4 17588 2004 35882 St.Paul Black 3
## 5 16987 2004 25306 St.Paul Grey 3
## 6 16987 2005 33399 St.Paul Black 2
carPrice1 <- fitModel(
Price ~ A + B * Age + C * Mileage, data = Hondas)
contour_plot(
carPrice1(Age = age, Mileage = miles) ~ age + miles,
domain(age = range(0, 8), miles = range(0, 60000)))
Pada grafik di atas, konturnya vertikal.
1.Apa yang dikatakan kontur vertikal tentang harga sebagai fungsi dari Age dan Mileage? a.Harga sangat tergantung pada kedua variabel. b.Harga tergantung Agetapi tidak Mileage. c.Harga tergantung Mileagetapi tidak Age. d.Harga tidak banyak bergantung pada salah satu variabel.
JAWABAN: Setiap kontur sesuai dengan harga yang berbeda. Saat Anda melacak secara horizontal dengan Age, Anda berpindah dari satu kontur ke kontur lainnya. Namun saat Anda melacak secara vertikal dengan Mileage, Anda tidak melewati kontur. Artinya harga tidak bergantung pada Mileage, karena perubahan Mileagetidak menyebabkan perubahan harga. Tapi harga tidak berubah dengan Age.
2.Grafik fungsi yang sama yang ditampilkan di badan teks memiliki kontur yang miring ke bawah dari kiri ke kanan. Apa yang dikatakan tentang harga sebagai fungsi dari Age dan Mileage? a.Harga sangat tergantung pada kedua variabel. b.Harga tergantung Agetapi tidak Mileage. c.Harga tergantung Mileagetapi tidak Age. d.Harga tidak banyak bergantung pada salah satu variabel.
JAWABAN: Saat Anda menjiplak secara horizontal, dengan Age, Anda berpindah dari kontur ke kontur: harga berubah. Jadi harga tergantung Age. Hal yang sama berlaku ketika Anda menjiplak secara vertikal, dengan Mileage. Jadi harga juga tergantung Mileage.
3.Fungsi yang sama digambarkan baik di badan teks maupun di latihan ini. Tapi grafiknya sangat berbeda! Jelaskan mengapa ada perbedaan dan sebutkan grafik mana yang benar.
JAWABAN: Perhatikan tanda centang pada sumbu. Dalam grafik di badan teks, Ageberjalan dari dua hingga delapan tahun. Namun dalam grafik latihan, Agehanya berjalan dari nol hingga satu tahun. Demikian pula, grafik di badan teks Mileageberjalan dari 0 hingga 60.000 mil, tetapi dalam grafik latihan, Mileageberjalan dari 0 hingga 1.
Kedua grafik menunjukkan fungsi yang sama, jadi keduanya “benar”. Tapi grafik latihan itu menyesatkan secara visual. Tidak mengherankan jika harga tidak banyak berubah dari 0 mil menjadi 1 mil, tetapi harganya (agak) berubah dari 0 tahun menjadi 1 tahun.
Moral di sini: Perhatikan baik-baik sumbu dan rentang yang ditampilkannya. Saat Anda menggambar grafik, pastikan Anda mengatur rentang ke sesuatu yang relevan dengan masalah yang dihadapi.
Ekonom biasanya berpikir tentang harga dalam logaritma mereka. Keuntungan dari melakukan ini adalah bahwa tidak masalah dalam mata uang apa harganya; kenaikan 1 harga log adalah proporsi yang sama terlepas dari harga atau mata uangnya. Pertimbangkan model dari log1 0harga sebagai fungsi dari mil dan usia.
logPrice2 <- fitModel(
logPrice ~ A + B * Age + C * Mileage + D * Age * Mileage,
data = Hondas %>% mutate(logPrice = log10(Price)))
Model ini didefinisikan untuk memasukkan interaksi antara usia dan jarak tempuh. Tentu saja, mungkin saja parameternya Dmendekati nol. Itu berarti bahwa data tidak memberikan bukti interaksi apa pun.
Sesuaikan model dan lihat kontur harga kayu gelondongan. Apa yang dikatakan bentuk kontur kepada Anda tentang apakah data memberikan bukti interaksi dalam harga log?
Jawab:
contour_plot(
logPrice2(Age=age, Mileage=miles) ~ age + miles,
domain(age = range(0, 8), miles = range(0, 60000)))
Menyesuaikan fungsi dengan data bukanlah sihir. Sejauh data membatasi bentuk model yang masuk akal, model tersebut akan cocok dengan data. Tetapi untuk input yang tidak ada datanya (misalnya mobil berusia 0 tahun dengan jarak tempuh 60.000 mil), sebuah model dapat melakukan hal-hal gila. Ini terutama terjadi jika modelnya rumit, katakanlah termasuk kekuatan variabel, seperti yang satu ini:
carPrice3 <- fitModel(
Price ~ A + B * Age + C * Mileage + D * Age * Mileage +
E * Age^2 + F * Mileage^2 + G * Age^2 * Mileage +
H * Age * Mileage^2,
data = Hondas)
gf_point(Mileage ~ Age, data = Hondas, fill = NA) %>%
contour_plot(
carPrice3(Age=Age, Mileage=Mileage) ~ Age + Mileage)
Untuk mobil di bawah 3 tahun atau lebih tua dengan jarak tempuh sangat tinggi atau sangat rendah, konturnya melakukan beberapa hal gila! Akal sehat mengatakan bahwa jarak tempuh yang lebih tinggi atau usia yang lebih besar menghasilkan harga yang lebih tinggi. Dalam hal kontur, akal sehat diterjemahkan menjadi kontur yang memiliki kemiringan negatif. Tetapi kemiringan kontur ini seringkali positif.
Ini membantu untuk mempertimbangkan apakah ada wilayah di mana hanya ada sedikit data. Sebagai aturan, model rumit seperti carPrice3()tidak dapat diandalkan untuk input di mana ada sedikit atau tidak ada data.
Fokus hanya pada wilayah plot di mana terdapat banyak data. Apakah kontur memiliki bentuk yang diharapkan oleh akal sehat?
JAWABAN: Di mana ada banyak data, bentuk lokal kontur memang miring ke bawah dari kiri ke kanan, seperti yang diantisipasi oleh akal sehat.