De levensverwachting is in de afgelopen eeuw drastisch veranderd in
de meeste landen. In deze praktische opdracht (po) kijken we naar de
levensverwachting van mannen in de Verenigde Staten in de periode
1900-2010.
We gaan de gegevens bekijken, en een model opstellen
voor de levensverwachting. Een model is een praktische toepassing van
wiskunde. Door het kiezen van de juiste (basis)formule en de parameters
aan te passen kun je veel situaties beschrijven.
Uiteindelijk schrijf je daar een kort verslag over.
In deze po staan zes opdrachten. De uitwerkingen
daarvan lever je in, in een ‘rapport’ ofwel verslag. Maak er niet te
veel werk van, maar ook weer niet te weinig. Gebruik MS Word als het
kan.
De beoordeling is relatief eenvoudig. Je krijgt per opdracht een aantal
punten, voor een totaal van 80. Ook krijg je 10 punten voor de
verzorging van je werk (netjes, geen taal- of stijlfouten, tijdig
ingeleverd, etc.). Dat geeft je 90 punten. 10 punten erbij omdat je geen
0 kan halen, en dan een komma ertussen voor een cijfer tussen 1 en 10.
Het doel bij het nakijken is dat je met gewone inzet (één hele middag,
ongeveer 4 uur) een redelijk cijfer (ongeveer een 71) haalt.
## Geboortejaar Levensverwachting
## 1 1900 48.3
## 2 1910 51.1
## 3 1920 55.2
## 4 1930 57.4
## 5 1940 62.5
## 6 1950 65.6
## 7 1960 66.6
## 8 1970 67.1
## 9 1980 70.0
## 10 1990 71.8
## 11 2000 73.0
## 12 2010 76.2
In de tabel hierboven zie je voor een aantal geboortejaren de levensverwachting bij de geboorte voor een man uit de Verenigde Staten. Dus iemand geboren in 1930 werd gemiddeld 57.4 jaar oud.
Een lineair model ken je misschien nog. We plotten eerst de gegevens
uit de tabel:
Je ziet hier de gegevens uit de tabel, maar dan in een zogenaamde ‘scatterplot’. Om de levensverwachting in 2030 te voorspellen, kunnen we een rechte lijn door de gegevens trekken, en kijken hoe deze lijn zich ontwikkelt:
## `geom_smooth()` using formula = 'y ~ x'
Opdracht 1 10p Stel een vergelijking op die bij deze lijn hoort, en bepaal op basis daarvan de verwachte levensverwachting in 2030.
Opdracht 2 10p Bepaal ook tot welke jaartallen (zowel terug vanaf 1900 als vooruit vanaf 2010) je vindt dat het lineair model realistische waarden geeft. Beargumenteer kort waarom je tot deze conclusie komt.
Een beter model houdt rekening met een onderste en bovenste
grenswaarde. Een gemiddelde levensverwachting kan sowieso niet negatief
zijn, maar ook jonger dan 10 lijkt een probleem. Op dezelfde manier kan
de levensverwachting wel stijgen, maar wordt die niet 200 jaar.
Je gaat proberen met behulp van translaties en transformaties de grafiek
van een (bijna) standaard logistisch model te laten passen bij de
gegevens die je hebt.
De standaard2 logistische functie is \(f(x) = \dfrac{1}{1+10^{-x}}\).
Opdracht 3 15p Plot en beschrijf deze standaardfunctie. Je ziet een S-vormige curve, die van 0 tot 1 loopt voor \(x\) van \(-\infty\) tot \(+\infty\). Laat met behulp van de formule (berekeningen daarmee) zien dat deze curve inderdaad van 0 tot 1 moet lopen als \(x\) tussen \(-\infty\) en \(\infty\) loopt? Laat ook met berekeningen met de formule en met de grafiek zien waarom de min voor de exponent (de \(x\)) nodig is in deze formule en wat er gebeurt als die min er niet staat.
Op geogebra.org
staat een begin van het model klaar. In het model zit het buigpunt bij
\(x=0\). Hoe moet je de formule
veranderen zodat het buigpunt bij \(x=1950\) zit zoals je ziet dat het ongeveer
is in de datapunten. Doe dit ook in geogebra. Je ziet ook de datapunten,
zoals in de afbeelding hieronder:
Opdracht 4 20p Gebruik een programma naar
keuze (GeoGebra wordt geadviseerd, maar ook Excel of je GR zou kunnen)
om translaties en transformaties uit te voeren totdat je vindt dat je
een grafiek hebt gevonden die past bij de datapunten. Beschrijf ook kort
waarom je deze transformaties gedaan hebt, en welk effect ze op de
grafiek hebben. Je ziet ook de gegevens uit de tabel in de opdracht als
blauwe punten (als je ze zelf moet toevoegen, kan dat bij GeoGebra via
“tabel”).
Hint: doe éérst de vermenigvuldigingen, en voer daarna de
translaties uit.
Opdracht 5 15p Ook het logistische model heeft voor- en nadelen. Geef één voordeel en één nadeel van jouw model ten opzichte van de lineaire benadering.
Opdracht 6 10p Eén probleem van het gebruiken van de gemiddelde levensverwachting is dat kindersterfte een sterke invloed heeft op de gemiddelde levensverwachting. Daardoor is het model minder goed bruikbaar om beleid op te stellen (denk bijvoorbeeld aan het verwachte aantal gepensioneerde mensen). Bedenk nog een factor die van invloed is op de gemiddelde levensverwachting die je niet terugziet in jouw model.