Inleiding

De levensverwachting is in de afgelopen eeuw drastisch veranderd in de meeste landen. In deze praktische opdracht (po) kijken we naar de levensverwachting van mannen in de Verenigde Staten in de periode 1900-2010.
We gaan de gegevens bekijken, en een model opstellen voor de levensverwachting. Een model is een praktische toepassing van wiskunde. Door het kiezen van de juiste (basis)formule en de parameters aan te passen kun je veel situaties beschrijven.
Uiteindelijk schrijf je daar een kort verslag over.

Voorwaarden en beoordeling

In deze po staan zes opdrachten. De uitwerkingen daarvan lever je in, in een ‘rapport’ ofwel verslag. Maak er niet te veel werk van, maar ook weer niet te weinig. Gebruik MS Word als het kan.
De beoordeling is relatief eenvoudig. Je krijgt per opdracht een aantal punten, voor een totaal van 80. Ook krijg je 10 punten voor de verzorging van je werk (netjes, geen taal- of stijlfouten, tijdig ingeleverd, etc.). Dat geeft je 90 punten. 10 punten erbij omdat je geen 0 kan halen, en dan een komma ertussen voor een cijfer tussen 1 en 10. Het doel bij het nakijken is dat je met gewone inzet (één hele middag, ongeveer 4 uur) een redelijk cijfer (ongeveer een 71) haalt.

Gegevens

##    Geboortejaar Levensverwachting
## 1          1900              48.3
## 2          1910              51.1
## 3          1920              55.2
## 4          1930              57.4
## 5          1940              62.5
## 6          1950              65.6
## 7          1960              66.6
## 8          1970              67.1
## 9          1980              70.0
## 10         1990              71.8
## 11         2000              73.0
## 12         2010              76.2

In de tabel hierboven zie je voor een aantal geboortejaren de levensverwachting bij de geboorte voor een man uit de Verenigde Staten. Dus iemand geboren in 1930 werd gemiddeld 57.4 jaar oud.

Lineair model

Een lineair model ken je misschien nog. We plotten eerst de gegevens uit de tabel:

Je ziet hier de gegevens uit de tabel, maar dan in een zogenaamde ‘scatterplot’. Om de levensverwachting in 2030 te voorspellen, kunnen we een rechte lijn door de gegevens trekken, en kijken hoe deze lijn zich ontwikkelt:

## `geom_smooth()` using formula = 'y ~ x'

Opdracht 1 10p Stel een vergelijking op die bij deze lijn hoort, en bepaal op basis daarvan de verwachte levensverwachting in 2030.

Opdracht 2 10p Bepaal ook tot welke jaartallen (zowel terug vanaf 1900 als vooruit vanaf 2010) je vindt dat het lineair model realistische waarden geeft. Beargumenteer kort waarom je tot deze conclusie komt.

Logistisch model

Een beter model houdt rekening met een onderste en bovenste grenswaarde. Een gemiddelde levensverwachting kan sowieso niet negatief zijn, maar ook jonger dan 10 lijkt een probleem. Op dezelfde manier kan de levensverwachting wel stijgen, maar wordt die niet 200 jaar.
Je gaat proberen met behulp van translaties en transformaties de grafiek van een (bijna) standaard logistisch model te laten passen bij de gegevens die je hebt.

De standaard2 logistische functie is \(f(x) = \dfrac{1}{1+10^{-x}}\).

Opdracht 3 15p Plot en beschrijf deze standaardfunctie. Je ziet een S-vormige curve, die van 0 tot 1 loopt voor \(x\) van \(-\infty\) tot \(+\infty\). Laat met behulp van de formule (berekeningen daarmee) zien dat deze curve inderdaad van 0 tot 1 moet lopen als \(x\) tussen \(-\infty\) en \(\infty\) loopt? Laat ook met berekeningen met de formule en met de grafiek zien waarom de min voor de exponent (de \(x\)) nodig is in deze formule en wat er gebeurt als die min er niet staat.

Op geogebra.org staat een begin van het model klaar. In het model zit het buigpunt bij \(x=0\). Hoe moet je de formule veranderen zodat het buigpunt bij \(x=1950\) zit zoals je ziet dat het ongeveer is in de datapunten. Doe dit ook in geogebra. Je ziet ook de datapunten, zoals in de afbeelding hieronder:
Afbeelding GeoGebra

Opdracht 4 20p Gebruik een programma naar keuze (GeoGebra wordt geadviseerd, maar ook Excel of je GR zou kunnen) om translaties en transformaties uit te voeren totdat je vindt dat je een grafiek hebt gevonden die past bij de datapunten. Beschrijf ook kort waarom je deze transformaties gedaan hebt, en welk effect ze op de grafiek hebben. Je ziet ook de gegevens uit de tabel in de opdracht als blauwe punten (als je ze zelf moet toevoegen, kan dat bij GeoGebra via “tabel”).
Hint: doe éérst de vermenigvuldigingen, en voer daarna de translaties uit.

Opdracht 5 15p Ook het logistische model heeft voor- en nadelen. Geef één voordeel en één nadeel van jouw model ten opzichte van de lineaire benadering.

Opdracht 6 10p Eén probleem van het gebruiken van de gemiddelde levensverwachting is dat kindersterfte een sterke invloed heeft op de gemiddelde levensverwachting. Daardoor is het model minder goed bruikbaar om beleid op te stellen (denk bijvoorbeeld aan het verwachte aantal gepensioneerde mensen). Bedenk nog een factor die van invloed is op de gemiddelde levensverwachting die je niet terugziet in jouw model.


  1. Dit is géén belofte! Dus ‘ik heb vier uur erin gestoken, dus ik heb recht op een zeven’ is geen acceptabel argument. Het gaat uiteindelijk om het resultaat.↩︎

  2. Eigenlijk is bij een logistische functie het grondtal \(\textrm{e}\), en niet \(10\), maar dat ligt buiten de scope van deze po.↩︎