Harga perumahan ditentukan oleh beberapa (atau banyak!) faktor. Menerjemahkan kalimat sebelumnya ke dalam bahasa fungsi, kita dapat mengatakan bahwa harga adalah fungsi dari beberapa input. Input yang masuk akal untuk fungsi ini termasuk jumlah ruang tamu dan jumlah kamar tidur dan kamar mandi. Input juga dapat mencakup kualitas lingkungan, lama perjalanan, dan sebagainya.
Seringkali, titik awal untuk membangun fungsi dengan beberapa input
adalah bingkai data yang variabelnya mencakup output fungsi (harga) dan
input ke fungsi. Pemodel sering memulai dengan membangun fungsi yang
merupakan kombinasi linier dari variabel input. Untuk menunjukkan
seperti apa fungsi-fungsi tersebut, kita dapat menggunakan dataset, yang
mencatat harga jual 1728 rumah di Saratoga County, New York, AS dan 15
variabel lain untuk setiap rumah, seperti dan jumlah dan
.SaratogaHouseslivingAreabedroomsbathrooms
Teknik untuk membangun fungsi dari data akan diperkenalkan di Blok
III. Untuk saat ini, mari kita lihat seperti apa fungsinya. Dari kami
membangun fungsi ini:SaratogaHouses
Ini bukan skalar buatan dalam kombinasi linier. Mereka telah
diturunkan dari data menggunakan metode yang disebut regresi
linier. “Linear” dalam nama mengacu pada “kombinasi
linier.”SaratogaHouses
harga(Ruang tamu,Kamar,Kamar mandi)≡21000+105Ruang tamu−13000Kamar+26000Kamar mandi
Fungsi model adalah kombinasi linier sederhana, tetapi secara efektif mengukur bagaimana berbagai aspek rumah berkontribusi pada harga jualnya. Model (yang didasarkan pada data dari dua dekade lalu) menunjukkan bahwa tambahan kaki persegi ruang tamu bernilai sekitar 105 dolar per kaki2. Kamar mandi tambahan bernilai sekitar $ 25.000. Kamar tidur, anehnya, diberi nilai negatif oleh model.
Mungkin Anda sudah mengerti apa yang dimaksud dengan “kaki persegi
tambahan” atau “kamar mandi tambahan.” Ide-ide ini bisa intuitif, tetapi
mereka dapat dipahami dengan baik dengan landasan dalam kalkulus, yang
kita beralih ke Blok II. Misalnya, skalar negatif pada akan masuk akal
ketika Anda memahami “turunan parsial,” subjek Bab 25.bedrooms
Bahkan jika Anda belum memiliki pemahaman teoritis tentang bagaimana
membangun fungsi dengan beberapa input dari data, Anda dapat operasi
R/mosaic untuk melakukannya. Fungsi kunci adalah , yang seperti ,
membangun fungsi. Dan, seperti , Anda perlu menggunakan ekspresi tilde
untuk menentukan rumus model. Tapi, tidak seperti , Anda dapat
menyerahkannya ke komputer untuk menemukan parameter yang akan membuat
fungsi sejajar dengan
data.fitModel()makeFun()makeFun()makeFun()
Sebagai ilustrasi, kita dapat membangun model harga perumahan dari data:`SaratogaHouses`
price <- fitModel(price ~ A + B*livingArea + C*bedrooms + D*bathrooms, data = SaratogaHouses)
Perhatikan bahwa dalam menerapkan fungsi ke input, kita menggunakan
nama-nama input secara eksplisit. Untuk menulis perintah berisiko
mencampuradukkan input mana.price()price(2000,3,2)
Gunakan fungsi dengan cara biasa. Misalnya, inilah yang dikatakan model tentang harga jual yang diantisipasi dari sebuah rumah dengan ruang tamu seluas 2000 kaki persegi, tiga kamar tidur, dan dua kamar mandi.
price(livingArea=2000, bedrooms=3, bathrooms=2) ## [1] 242448.1
Unit output sama dengan unit dalam bingkai data:
dolar.priceSaratogaHouses
Untuk melihat fungsi, beri nama fungsi tanpa tanda kurung,
misalnya . Sebaliknya, Anda akan selalu menggunakan tanda kurung saat
menerapkan fungsi ke input.price
Untuk alasan teknis, fungsi yang dibuat oleh memiliki banyak jargon
pemrograman komputer di dalamnya, seperti yang Anda lihat dengan
membangun model itu sendiri dan kemudian melihat fungsinya. Tetapi Anda
juga akan melihat nilai parameter yang ditemukan oleh
.fitModel()fitModel()