Kebanyakan orang menemukan data dalam bentuk tabel cetak, seperti Bill of Mortality 1665 yang ditunjukkan di bawah ini. Tabel-tabel ini dikembangkan agar dapat dibaca oleh manusia dan menjadi kompak saat dicetak.
Meskipun diterbitkan lebih dari 350 tahun yang lalu, masih mungkin bagi manusia yang melek huruf untuk memilah apa yang dikatakan tabel. Tetapi volume data telah meledak melampaui kemungkinan mencetaknya. Sebagai gantinya, data hari ini disimpan dan diakses secara elektronik. Tetapi proses mengakses data tersebut sangat berakar pada notasi tabel “,” meskipun tabel yang mengikuti serangkaian prinsip yang ketat. Kami akan memanggil tabel tersebut bingkai data dan penting bagi Anda untuk mempelajari beberapa prinsip inti organisasi data.
Pertama, kenali bahwa data ditampilkan di Gambar 1.1 terdiri dari beberapa tabel berbeda. Tabel pertama, tepat di bawah judul, dimulai dengan
| Parish | Buried | Plague |
|---|---|---|
| St Albans Woodstreet | 100 | 121 |
| St Alhallowes Barking | 514 | 330 |
| St Clemens Eastcheap | 18 | 78 |
| St Diones Back-church | 78 | 27 |
Bentuk modern ini tidak tersebar di lebar halaman. Ini memiliki satu set kolom daripada set diulang berdampingan seperti di Tabel 1.1.
| Parish | Buried | Plague |
|---|---|---|
| St Albans Woodstreet | 100 | 121 |
| St Alhallowes Barking | 514 | 330 |
| St Clemens Eastcheap | 18 | 78 |
| St Diones Back-church | 78 | 27 |
Masing-masing kolom dari tabel modern disebut a variabel. Jadi ada variabel “ terkubur ” yang berisi angka yang terkubur dan variabel lain “ wabah ” yang mengandung jumlah yang meninggal karena wabah.
Setiap baris tabel disebut a kasus, tetapi sering hanya baris digunakan. Untuk setiap meja, semua kasing adalah jenis yang sama, misalnya, di sini, sebuah paroki.
Tabel lain yang ditampilkan pada lembar berjudul, “ Penyakit dan korban tahun ini. ” Dalam tabel ini, kasusnya adalah penyakit atau penyebab kematian lainnya, yang kami beri nama “ kondisi. ”
| condition | deaths | year |
|---|---|---|
| Abortive and Stilborne | 617 | 1665 |
| Aged | 1545 | 1665 |
| Ague and Feaver | 5257 | 1665 |
| Appoplex and Suddenly | 116 | 1665 |
| Bedrid | 10 | 1665 |
Kami telah menambahkan variabel “ tahun ” dengan tujuan untuk mengkonsolidasikan tagihan selama bertahun-tahun ke dalam satu tabel.
Sebuah organisasi modern untuk data yang disajikan dalam Bill of Mortality akan kembali ke catatan mentah yang dikumpulkan di lapangan, menumpuknya menjadi hanya dua tabel: Kematian dan Kelahiran. Tabel Deaths mungkin terlihat seperti Tabel 1.3.
| Name | Date | Parish | Sex | Age | Cause |
|---|---|---|---|---|---|
| Percivell Bullingham | 1658 | St Mary le Bow | M | 29 | plague |
| Owin Swancott | 1644 | Trinitie | M | 2 | plague |
| Winifred Romford | 1645 | St Swithings | F | 19 | childbed |
| Elsebeth Cook | 1630 | St Ethelborough | F | 5 | plague |
| Humfray Langham | 1654 | St Bennet Fynch | M | 53 | aged |
| Agnes Kirkwood | 1632 | St Mary Hill | F | 21 | ague |
| Katherine Murton | 1652 | St Alholowes Lesse | F | 24 | childbed |
| Bainbridge Fletcher | 1645 | St Martins | M | 2 | plague |
| Cicely Ouston | 1654 | St Austins | F | 35 | plague |
Konsepsi data modern membuat perbedaan yang jelas antara data dan konstruksi ringkasan data tersebut untuk konsumsi manusia. Ringkasan seperti itu mungkin grafis, atau dalam fungsi model bentuk, atau bahkan dalam bentuk seperangkat tabel, seperti yang terlihat dalam Bill of Mortality. Mempelajari cara menghasilkan ringkasan semacam itu adalah tugas penting statistik dan ilmu data. Konstruksi otomatis fungsi model (tanpa banyak intervensi manusia) adalah bidang yang disebut pembelajaran mesin
Dalam tabel Kematian, yang akan memiliki 97.306 baris untuk 1665, setiap kasus adalah “ seseorang yang meninggal. ” Tabel seperti itu saat ini dapat ditabulasi ulang ke dalam tabel “ penyakit dan korban ”, atau pemecahan penguburan berdasarkan jenis kelamin, atau pemecahan paroki demi paroki. Tetapi ada banyak kemungkinan lain: melihat penyebab kematian berdasarkan usia dan musim dalam setahun, atau dikelompokkan berdasarkan jenis kelamin, dll.