FAO Food Balance zawiera dane dotyczące spożycia różnych produktów w kg/głowę/rok. Pominięto kraje o liczbie ludności mniejszej niż 500 tys (w roku 2017). Kraje są podzielone na dwie grupy: kraje OECD oraz resztę.
Kraje OECD dla ścisłości to kraje:
## [1] "Australia, Austria, Belgium, Canada, Chile, Colombia, Czechia, Denmark, Estonia, Finland, France, Germany, Greece, Hungary, Ireland, Israel, Italy, Japan, Latvia, Lithuania, Luxembourg, Mexico, Netherlands, New Zealand, Norway, Poland, Portugal, Slovakia, Slovenia, Spain, Sweden, Switzerland, Turkey, United Kingdom, United States of America"
W tej grupie średnio rocznie spożywano 0.2368571 kg; mediana 0.18 kg (w połowie krajów OECD spożycie wynosi 0.18 kg i mniej); pierwszy/trzeci kwartyl 0.1/0.275 kg (w 1/4 krajów OECD spożycie wynosi 0.1 kg i mniej; w 1/4 krajów OECD spożycie wynosi 0.275 kg i więcej;
Odchylenie standardowe 0.2811193 kg (przeciętnie odchylenie od średniej arytmetycznej wynosi 0.2811193 kg); rozstęp ćwiartkowy wynosi 0.175 kg (rozstęp 50% środkowych wartości wynosi 0.175 kg)
Histogram przy przyjęciu długości przedziału równej 0.2kg (linia zielona oznacza wartość średnią):
Średnio 1.8739167 kg; mediana 0.03 kg (w połowie krajów OECD spożycie wynosi 0.03 kg i mniej); pierwszy/trzeci kwartyl 0/0.2575 kg (w 1/4 krajów OECD spożycie wynosi 0 kg i mniej; w 1/4 krajów OECD spożycie wynosi 0.2575 kg i więcej;
Odchylenie standardowe 6.6015011 kg (przeciętnie odchylenie od średniej arytmetycznej wynosi 6.6015011 kg); rozstęp ćwiartkowy wynosi 0.2575 kg (rozstęp 50% środkowych wartości wynosi 0.2575 kg)
Histogram przy przyjęciu długości przedziału równej 0.2kg (linia zielona oznacza wartość średnią):
Rozkład w grupie reszta świata NIE jest porządny w sensie że większość obserwacji nie jest w okolicach średniej. Zniekształcenie spowodowane jest obecnością wielkości nietypowych (ang. outliers); wartości nietypowe zawyżają (lub zaniżają) średnią, która przestaje być wartością, wokół której znajduje się znaczna liczba obserwacji (czego oczekujemy od średniej).
Miara | OECD | reszta |
---|---|---|
średnia | 0.2368571 | 1.8739167 |
mediana | 0.18 | 0.03 |
odchyl.st | 0.2811193 | 6.6015011 |
iqr | 0.175 | 0.2575 |
średnia dla reszty jest znacznie wyższa niż w krajach OECD ale już mediana dla reszty jest znacznie niższa. Zmienność mierzona wielkością odchylenia standardowego jest znacznie wyższa dla reszty i dużo mniejsza jeżeli mierzymy ją za pomocą IQR.
Porównanie rozkładów za pomocą histogramu jest trudne z uwagi na dużą różnicę w wielkości rozstępu.
W takiej sytuacji warto zidentyfikować owe wielkości nietypowe. Często używanym kryterium typowości jest podwójna nierówność \[q1 - 1,5 iqr < x < q3 + 1,5 iqr\] czyli obserwacja większa od \(q3 + 1,5iqr\) oraz mniejsza od \(q1 - 1,5 iqr\) będzie nietypowa. Wśród krajów OECD nietypowe są:
kraj | konsumpcja |
---|---|
Denmark | 0.57 |
Israel | 1.56 |
Turkey | 0.80 |
wśród reszty krajów zaś:
kraj | konsumpcja |
---|---|
Albania | 4.10 |
Algeria | 20.88 |
Chad | 1.18 |
Djibouti | 2.56 |
Egypt | 14.70 |
Iran (Islamic Republic of) | 10.02 |
Iraq | 5.66 |
Jordan | 3.31 |
Kazakhstan | 1.21 |
Kuwait | 22.36 |
Lebanon | 1.74 |
Malaysia | 0.73 |
Mauritania | 5.63 |
Morocco | 3.36 |
Niger | 1.57 |
Oman | 52.27 |
Pakistan | 1.63 |
Saudi Arabia | 34.87 |
Sudan | 9.57 |
Tunisia | 6.70 |
United Arab Emirates | 11.91 |
Yemen | 2.49 |
Konsumpacja w Omanie ma wartość 27 razy większą od śedniej (2700%) oraz 1733 razy większą od mediany (173300%)
W tym miejscu można zakończyć analizę albo policzyć jeszcze wartości trymowane (trimmed), tj po wykluczeniu wartości nietypowych
Średnio 0.1675 kg; mediana 0.155 kg (w połowie krajów OECD spożycie wynosi 0.155 kg i mniej); pierwszy/trzeci kwartyl 0.09/0.24 kg (w 1/4 krajów OECD spożycie wynosi 0.09 kg i mniej; w 1/4 krajów OECD spożycie wynosi 0.24 kg i więcej;
Odchylenie standardowe 0.1068916 kg (przeciętnie odchylenie od średniej arytmetycznej wynosi 0.1068916); rozstęp ćwiartkowy wynosi 0.15 kg (rozstęp 50% środkowych wartości wynosi 0.15 kg)
Histogram przy przyjęciu długości przedziału równej 0.1kg:
Średnio 0.0655102; mediana 0.01 (w połowie krajów OECD spożycie wynosi 0.01 i mniej); pierwszy/trzeci kwartyl 0/0.0775 (w 1/4 krajów OECD spożycie wynosi 0 i mniej; w 1/4 krajów OECD spożycie wynosi 0.0775 i więcej;
Odchylenie standardowe 0.1044092 (przeciętnie odchylenie od średniej arytmetycznej wynosi 0.1044092); rozstęp ćwiartkowy wynosi 0.0775 (rozstęp 50% środkowych wartości wynosi 0.0775)
Histogram przy przyjęciu długości przedziału równej 0.1kg:
Miara | OECD | reszta |
---|---|---|
średnia | 0.1675 | 0.0655102 |
mediana | 0.155 | 0.01 |
odchyl.st | 0.1068916 | 0.1044092 |
iqr | 0.15 | 0.0775 |
średnia
mediana
kwartyle
odchylenie standardowe
odchylenie ćwiartkowe (IQR)
histogram (wykres)
https://raw.githubusercontent.com/hrpunio/DataDir/master/fao-food-balance-2017/fb2017.csv
(Uwaga: część dziesiętna liczby jest oddzielona kropką a nie przecinkiem)