1.3 Tabel data dari Bill of Mortality 1665 untuk London.
1.3 Tabel data dari Bill of Mortality 1665 untuk London.

Kebanyakan orang menemukan data dalam bentuk tabel cetak, seperti Bill of Mortality 1665 yang ditunjukkan di bawah ini. Tabel-tabel ini dikembangkan agar dapat dibaca oleh manusia dan menjadi kompak saat dicetak.

Meskipun diterbitkan lebih dari 350 tahun yang lalu, masih mungkin bagi manusia yang melek huruf untuk memilah apa yang dikatakan tabel. Tetapi volume data telah meledak melampaui kemungkinan mencetaknya. Sebagai gantinya, data hari ini disimpan dan diakses secara elektronik. Tetapi proses mengakses data tersebut sangat berakar pada notasi tabel “,” meskipun tabel yang mengikuti serangkaian prinsip yang ketat. Kami akan memanggil tabel tersebut bingkai data dan penting bagi Anda untuk mempelajari beberapa prinsip inti organisasi data.

Pertama, kenali bahwa data ditampilkan di Gambar 1.1 terdiri dari beberapa tabel berbeda. Tabel pertama, tepat di bawah judul, dimulai dengan

Tabel 1.1: Dua baris pertama dari tabel utama dari Bill of Mortality
Parish Buried Plague
St Albans Woodstreet 100 121
St Alhallowes Barking 514 330
St Clemens Eastcheap 18 78
St Diones Back-church 78 27

Bentuk modern ini tidak tersebar di lebar halaman. Ini memiliki satu set kolom daripada set diulang berdampingan seperti di Tabel 1.1.

Tabel 1.2: Dalam format modern, semua paroki terdaftar dalam satu kolom, sehingga setiap baris tabel sesuai dengan satu paroki.
Parish Buried Plague
St Albans Woodstreet 100 121
St Alhallowes Barking 514 330
St Clemens Eastcheap 18 78
St Diones Back-church 78 27

Masing-masing kolom dari tabel modern disebut a variabel. Jadi ada variabel “ terkubur ” yang berisi angka yang terkubur dan variabel lain “ wabah ” yang mengandung jumlah yang meninggal karena wabah.

Setiap baris tabel disebut a kasus, tetapi sering hanya baris digunakan. Untuk setiap meja, semua kasing adalah jenis yang sama, misalnya, di sini, sebuah paroki.

Tabel lain yang ditampilkan pada lembar berjudul, “ Penyakit dan korban tahun ini. ” Dalam tabel ini, kasusnya adalah penyakit atau penyebab kematian lainnya, yang kami beri nama “ kondisi. ”

condition deaths year
Abortive and Stilborne 617 1665
Aged 1545 1665
Ague and Feaver 5257 1665
Appoplex and Suddenly 116 1665
Bedrid 10 1665

Kami telah menambahkan variabel “ tahun ” dengan tujuan untuk mengkonsolidasikan tagihan selama bertahun-tahun ke dalam satu tabel.

Sebuah organisasi modern untuk data yang disajikan dalam Bill of Mortality akan kembali ke catatan mentah yang dikumpulkan di lapangan, menumpuknya menjadi hanya dua tabel: Kematian dan Kelahiran. Tabel Deaths mungkin terlihat seperti Tabel 1.3.

Tabel 1.3: Pengorganisasian ulang data yang dibayangkan yang masuk ke dalam laporan Bill of Mortality.
Name Date Parish Sex Age Cause
Percivell Bullingham 1658 St Mary le Bow M 29 plague
Owin Swancott 1644 Trinitie M 2 plague
Winifred Romford 1645 St Swithings F 19 childbed
Elsebeth Cook 1630 St Ethelborough F 5 plague
Humfray Langham 1654 St Bennet Fynch M 53 aged
Agnes Kirkwood 1632 St Mary Hill F 21 ague
Katherine Murton 1652 St Alholowes Lesse F 24 childbed
Bainbridge Fletcher 1645 St Martins M 2 plague
Cicely Ouston 1654 St Austins F 35 plague

Konsepsi data modern membuat perbedaan yang jelas antara data dan konstruksi ringkasan data tersebut untuk konsumsi manusia. Ringkasan seperti itu mungkin grafis, atau dalam fungsi model bentuk, atau bahkan dalam bentuk seperangkat tabel, seperti yang terlihat dalam Bill of Mortality. Mempelajari cara menghasilkan ringkasan semacam itu adalah tugas penting statistik dan ilmu data. Konstruksi otomatis fungsi model (tanpa banyak intervensi manusia) adalah bidang yang disebut pembelajaran mesin

Dalam tabel Kematian, yang akan memiliki 97.306 baris untuk 1665, setiap kasus adalah “ seseorang yang meninggal. ” Tabel seperti itu saat ini dapat ditabulasi ulang ke dalam tabel “ penyakit dan korban ”, atau pemecahan penguburan berdasarkan jenis kelamin, atau pemecahan paroki demi paroki. Tetapi ada banyak kemungkinan lain: melihat penyebab kematian berdasarkan usia dan musim dalam setahun, atau dikelompokkan berdasarkan jenis kelamin, dll.