Żródło danych

FAO Food Balance zawiera dane dotyczące spożycia różnych produktów w kg/głowę/rok. Pominięto kraje o liczbie ludności mniejszej niż 500 tys (w roku 2017). Kraje są podzielone na dwie grupy: kraje OECD oraz resztę.

Spożycie w grupie krajów OECD

Kraje OECD dla ścisłości to kraje:

## [1] "Australia, Austria, Belgium, Canada, Chile, Colombia, Czechia, Denmark, Estonia, Finland, France, Germany, Greece, Hungary, Ireland, Israel, Italy, Japan, Latvia, Lithuania, Luxembourg, Mexico, Netherlands, New Zealand, Norway, Poland, Portugal, Slovakia, Slovenia, Spain, Sweden, Switzerland, Turkey, United Kingdom, United States of America"

W tej grupie średnio rocznie spożywano 0.2368571 kg; mediana 0.18 kg (w połowie krajów OECD spożycie wynosi 0.18 kg i mniej); pierwszy/trzeci kwartyl 0.1/0.275 kg (w 1/4 krajów OECD spożycie wynosi 0.1 kg i mniej; w 1/4 krajów OECD spożycie wynosi 0.275 kg i więcej;

Odchylenie standardowe 0.2811193 kg (przeciętnie odchylenie od średniej arytmetycznej wynosi 0.2811193 kg); rozstęp ćwiartkowy wynosi 0.175 kg (rozstęp 50% środkowych wartości wynosi 0.175 kg)

Histogram przy przyjęciu długości przedziału równej 0.2kg (linia zielona oznacza wartość średnią):

W pozostałych krajach

Średnio 1.8739167 kg; mediana 0.03 kg (w połowie krajów OECD spożycie wynosi 0.03 kg i mniej); pierwszy/trzeci kwartyl 0/0.2575 kg (w 1/4 krajów OECD spożycie wynosi 0 kg i mniej; w 1/4 krajów OECD spożycie wynosi 0.2575 kg i więcej;

Odchylenie standardowe 6.6015011 kg (przeciętnie odchylenie od średniej arytmetycznej wynosi 6.6015011 kg); rozstęp ćwiartkowy wynosi 0.2575 kg (rozstęp 50% środkowych wartości wynosi 0.2575 kg)

Histogram przy przyjęciu długości przedziału równej 0.2kg (linia zielona oznacza wartość średnią):

Porównanie OECD vs Reszta

Rozkład w grupie reszta świata NIE jest porządny w sensie że większość obserwacji nie jest w okolicach średniej. Zniekształcenie spowodowane jest obecnością wielkości nietypowych (ang. outliers); wartości nietypowe zawyżają (lub zaniżają) średnią, która przestaje być wartością, wokół której znajduje się znaczna liczba obserwacji (czego oczekujemy od średniej).

Miara OECD reszta
średnia 0.2368571 1.8739167
mediana 0.18 0.03
odchyl.st 0.2811193 6.6015011
iqr 0.175 0.2575

średnia dla reszty jest znacznie wyższa niż w krajach OECD ale już mediana dla reszty jest znacznie niższa. Zmienność mierzona wielkością odchylenia standardowego jest znacznie wyższa dla reszty i dużo mniejsza jeżeli mierzymy ją za pomocą IQR.

Porównanie rozkładów za pomocą histogramu jest trudne z uwagi na dużą różnicę w wielkości rozstępu.

W takiej sytuacji warto zidentyfikować owe wielkości nietypowe. Często używanym kryterium typowości jest podwójna nierówność \[q1 - 1,5 iqr < x < q3 + 1,5 iqr\] czyli obserwacja większa od \(q3 + 1,5iqr\) oraz mniejsza od \(q1 - 1,5 iqr\) będzie nietypowa. Wśród krajów OECD nietypowe są:

kraj konsumpcja
Denmark 0.57
Israel 1.56
Turkey 0.80

wśród reszty krajów zaś:

kraj konsumpcja
Albania 4.10
Algeria 20.88
Chad 1.18
Djibouti 2.56
Egypt 14.70
Iran (Islamic Republic of) 10.02
Iraq 5.66
Jordan 3.31
Kazakhstan 1.21
Kuwait 22.36
Lebanon 1.74
Malaysia 0.73
Mauritania 5.63
Morocco 3.36
Niger 1.57
Oman 52.27
Pakistan 1.63
Saudi Arabia 34.87
Sudan 9.57
Tunisia 6.70
United Arab Emirates 11.91
Yemen 2.49

Konsumpacja w Omanie ma wartość 27 razy większą od śedniej (2700%) oraz 1733 razy większą od mediany (173300%)

W tym miejscu można zakończyć analizę albo policzyć jeszcze wartości trymowane (trimmed), tj po wykluczeniu wartości nietypowych

Wartości trymowane

OECD

Średnio 0.1675 kg; mediana 0.155 kg (w połowie krajów OECD spożycie wynosi 0.155 kg i mniej); pierwszy/trzeci kwartyl 0.09/0.24 kg (w 1/4 krajów OECD spożycie wynosi 0.09 kg i mniej; w 1/4 krajów OECD spożycie wynosi 0.24 kg i więcej;

Odchylenie standardowe 0.1068916 kg (przeciętnie odchylenie od średniej arytmetycznej wynosi 0.1068916); rozstęp ćwiartkowy wynosi 0.15 kg (rozstęp 50% środkowych wartości wynosi 0.15 kg)

Histogram przy przyjęciu długości przedziału równej 0.1kg:

Reszta

Średnio 0.0655102; mediana 0.01 (w połowie krajów OECD spożycie wynosi 0.01 i mniej); pierwszy/trzeci kwartyl 0/0.0775 (w 1/4 krajów OECD spożycie wynosi 0 i mniej; w 1/4 krajów OECD spożycie wynosi 0.0775 i więcej;

Odchylenie standardowe 0.1044092 (przeciętnie odchylenie od średniej arytmetycznej wynosi 0.1044092); rozstęp ćwiartkowy wynosi 0.0775 (rozstęp 50% środkowych wartości wynosi 0.0775)

Histogram przy przyjęciu długości przedziału równej 0.1kg:

Porównanie

Miara OECD reszta
średnia 0.1675 0.0655102
mediana 0.155 0.01
odchyl.st 0.1068916 0.1044092
iqr 0.15 0.0775

Wykorzystywane metody statystyczne

średnia

mediana

kwartyle

odchylenie standardowe

odchylenie ćwiartkowe (IQR)

histogram (wykres)

Dane

https://raw.githubusercontent.com/hrpunio/DataDir/master/fao-food-balance-2017/fb2017.csv

(Uwaga: część dziesiętna liczby jest oddzielona kropką a nie przecinkiem)