Hoofdstuk 4. Verkennen van een externe dataset (uitgewerkt voorbeeld).

De eerste stap in datavisualisatie is de dataset analyseren. Zowel statistisch als visueel analyseren om patronen, trends of opvallende zaken op te sporen.

  1. Wat nemen we op in de weergave van de dataset?

  2. Wat tonen we aan het/een publiek?

  3. En welk verhaal laten we de data vertellen?

We sluiten af met een toepassing van een datavisualisatie op deze dataset van het Central Park in New York.


knitr::opts_chunk$set(echo = TRUE)

library(readr)
NewYorkCentralParkTemperatuur_1_ <- read_delim("NewYorkCentralParkTemperatuur (1).csv", 
    ";", escape_double = FALSE, trim_ws = TRUE)
## 
## -- Column specification --------------------------------------------------------
## cols(
##   Jaar = col_double(),
##   Jan = col_double(),
##   Feb = col_double(),
##   Mar = col_double(),
##   Apr = col_double(),
##   Mei = col_double(),
##   Jun = col_double(),
##   Jul = col_double(),
##   Aug = col_double(),
##   Sep = col_double(),
##   Okt = col_double(),
##   Nov = col_double(),
##   Dec = col_double(),
##   Jaargemiddelde = col_double()
## )
klimaatNY=NewYorkCentralParkTemperatuur_1_

Verkenning: x waarnemingen (rijen) en y variabelen (kolommen)en van iedere variabele een voorbeeld.

str(klimaatNY)
## spec_tbl_df [151 x 14] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ Jaar          : num [1:151] 1869 1870 1871 1872 1873 ...
##  $ Jan           : num [1:151] 1.7 3.1 -2.1 -1.8 -1.9 1.2 -4.6 2.6 -2.4 -0.9 ...
##  $ Feb           : num [1:151] 1.4 -0.4 -1 -1.2 -1.4 -0.4 -3.8 -0.1 2.8 0.1 ...
##  $ Mar           : num [1:151] 1.6 1.2 6.8 -0.8 2.1 2.8 1.2 1.3 2.1 6.7 ...
##  $ Apr           : num [1:151] 9.6 10.4 11.1 9.7 8.2 5.1 6.2 8.3 8.7 11.8 ...
##  $ Mei           : num [1:151] 14.3 16.1 15.8 16.4 14.9 14.9 15.6 15.7 15.3 15.2 ...
##  $ Jun           : num [1:151] 20.7 22.7 20.1 21.8 21.3 21.2 20.7 23.1 21.2 19.8 ...
##  $ Jul           : num [1:151] 22.7 24.8 22.4 25.3 24.1 23.3 23.3 26.3 23.9 25.4 ...
##  $ Aug           : num [1:151] 22.1 24.1 23.1 24.2 22.2 21.3 22.7 24 24.1 23.4 ...
##  $ Sep           : num [1:151] 18.7 19.8 16 19.1 18.6 19.4 17.8 17.6 19.4 20.2 ...
##  $ Okt           : num [1:151] 10.5 13.7 13.1 11.8 13.2 12.8 12 10.3 13.2 14.8 ...
##  $ Nov           : num [1:151] 4.6 7.5 3.8 5 2.8 6.3 4.1 7.3 6.9 6.6 ...
##  $ Dec           : num [1:151] 1.5 1.2 -1.6 -2.9 2.5 1 1.1 -3.9 3 0.4 ...
##  $ Jaargemiddelde: num [1:151] 10.8 12 10.6 10.6 10.6 10.7 9.7 11.1 11.6 12 ...
##  - attr(*, "spec")=
##   .. cols(
##   ..   Jaar = col_double(),
##   ..   Jan = col_double(),
##   ..   Feb = col_double(),
##   ..   Mar = col_double(),
##   ..   Apr = col_double(),
##   ..   Mei = col_double(),
##   ..   Jun = col_double(),
##   ..   Jul = col_double(),
##   ..   Aug = col_double(),
##   ..   Sep = col_double(),
##   ..   Okt = col_double(),
##   ..   Nov = col_double(),
##   ..   Dec = col_double(),
##   ..   Jaargemiddelde = col_double()
##   .. )
      dim(klimaatNY)
## [1] 151  14
      # toon de eerste 20 rijen van de data
      
      
      head(klimaatNY, n=20)
      # toon de laatste 20 rijen van de data
      
      tail(klimaatNY,n=20)
      # rijen
      nrow(klimaatNY)
## [1] 151
      #kolommen
      ncol(klimaatNY)
## [1] 14
      #kolomnamen
      names(klimaatNY)
##  [1] "Jaar"           "Jan"            "Feb"            "Mar"           
##  [5] "Apr"            "Mei"            "Jun"            "Jul"           
##  [9] "Aug"            "Sep"            "Okt"            "Nov"           
## [13] "Dec"            "Jaargemiddelde"
      #of
      colnames(klimaatNY)
##  [1] "Jaar"           "Jan"            "Feb"            "Mar"           
##  [5] "Apr"            "Mei"            "Jun"            "Jul"           
##  [9] "Aug"            "Sep"            "Okt"            "Nov"           
## [13] "Dec"            "Jaargemiddelde"
      #statistische samenvatting van een dataset
      summary(klimaatNY)
##       Jaar           Jan                 Feb               Mar        
##  Min.   :1869   Min.   :-5.700000   Min.   :-6.7000   Min.   :-1.100  
##  1st Qu.:1906   1st Qu.:-1.750000   1st Qu.:-1.2500   1st Qu.: 3.050  
##  Median :1944   Median : 0.000000   Median : 0.6000   Median : 4.600  
##  Mean   :1944   Mean   :-0.002649   Mean   : 0.4768   Mean   : 4.656  
##  3rd Qu.:1982   3rd Qu.: 1.700000   3rd Qu.: 2.3000   3rd Qu.: 6.200  
##  Max.   :2019   Max.   : 6.200000   Max.   : 5.6000   Max.   :10.600  
##       Apr             Mei             Jun             Jul       
##  Min.   : 5.10   Min.   :12.40   Min.   :17.90   Min.   :21.50  
##  1st Qu.: 9.45   1st Qu.:15.55   1st Qu.:21.00   1st Qu.:23.70  
##  Median :10.60   Median :16.50   Median :21.80   Median :24.60  
##  Mean   :10.67   Mean   :16.64   Mean   :21.68   Mean   :24.57  
##  3rd Qu.:11.95   3rd Qu.:17.80   3rd Qu.:22.55   3rd Qu.:25.35  
##  Max.   :14.40   Max.   :20.40   Max.   :24.60   Max.   :27.40  
##       Aug             Sep             Okt             Nov        
##  Min.   :20.30   Min.   :16.00   Min.   : 9.20   Min.   : 2.800  
##  1st Qu.:22.80   1st Qu.:19.20   1st Qu.:12.80   1st Qu.: 6.800  
##  Median :23.60   Median :19.90   Median :14.10   Median : 7.800  
##  Mean   :23.67   Mean   :19.96   Mean   :13.95   Mean   : 7.887  
##  3rd Qu.:24.40   3rd Qu.:20.95   3rd Qu.:14.90   3rd Qu.: 9.150  
##  Max.   :26.80   Max.   :23.60   Max.   :17.80   Max.   :11.600  
##       Dec         Jaargemiddelde 
##  Min.   :-3.900   Min.   : 9.60  
##  1st Qu.: 0.800   1st Qu.:11.65  
##  Median : 2.200   Median :12.20  
##  Mean   : 2.226   Mean   :12.21  
##  3rd Qu.: 3.800   3rd Qu.:12.85  
##  Max.   :10.400   Max.   :14.10
      #samenvatting voor één variabele
      summary(klimaatNY$Jan)
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -5.700000 -1.750000  0.000000 -0.002649  1.700000  6.200000
      #gemiddelde berekenen
      mean(klimaatNY$Jan)
## [1] -0.002649007
      mean(klimaatNY$Aug)
## [1] 23.66755
      mean(klimaatNY$Dec)
## [1] 2.22649
      mean(klimaatNY$Jaargemiddelde)
## [1] 12.20728
      #mediaan berekenen
      median(klimaatNY$Jan)
## [1] 0
      median(klimaatNY$Aug)
## [1] 23.6
      median(klimaatNY$Dec  )
## [1] 2.2
      # minimum, 1e kwartiel, mediaan, 3e kwartiel, maximum
      fivenum(klimaatNY$Jaargemiddelde)
## [1]  9.60 11.65 12.20 12.85 14.10
      fivenum(klimaatNY$Jan)
## [1] -5.70 -1.75  0.00  1.70  6.20
      #Hoeveel NA"s zijn er? Not Available"s |  FALSE of "0" = ze zijn er niet

      sum(is.na(klimaatNY))
## [1] 0
      #Waar zitten de NA"s? Toon alle waarden en laat zien of ze NA zijn
      
      #is.na(klimaatNY)
      
      #standaardafwijking
      sd(klimaatNY$Jaargemiddelde)
## [1] 0.9380191
      #variantie
      var(klimaatNY$Jaargemiddelde)
## [1] 0.8798799
      # Minimum en maximum functies
      min(klimaatNY$Jaargemiddelde)
## [1] 9.6
      max(klimaatNY$Jaargemiddelde)
## [1] 14.1
      #correlatie
      cor(klimaatNY$Jan,klimaatNY$Jaargemiddelde)
## [1] 0.4280135
      cor(klimaatNY$Aug,klimaatNY$Jaargemiddelde)
## [1] 0.5569432
      cor(klimaatNY$Jaar,klimaatNY$Jaargemiddelde)
## [1] 0.7471188
      # 1=volledige correlatie of negatief of positief tov de waarde 1
      # -0.7761684 is bijvoorbeeld een sterk negatieve correlatie
knitr::kable(
  klimaatNY[1:151, 1:14], caption = "151 jaar Temperatuurgegevens Central Park New York."
)
151 jaar Temperatuurgegevens Central Park New York.
Jaar Jan Feb Mar Apr Mei Jun Jul Aug Sep Okt Nov Dec Jaargemiddelde
1869 1.7 1.4 1.6 9.6 14.3 20.7 22.7 22.1 18.7 10.5 4.6 1.5 10.8
1870 3.1 -0.4 1.2 10.4 16.1 22.7 24.8 24.1 19.8 13.7 7.5 1.2 12.0
1871 -2.1 -1.0 6.8 11.1 15.8 20.1 22.4 23.1 16.0 13.1 3.8 -1.6 10.6
1872 -1.8 -1.2 -0.8 9.7 16.4 21.8 25.3 24.2 19.1 11.8 5.0 -2.9 10.6
1873 -1.9 -1.4 2.1 8.2 14.9 21.3 24.1 22.2 18.6 13.2 2.8 2.5 10.6
1874 1.2 -0.4 2.8 5.1 14.9 21.2 23.3 21.3 19.4 12.8 6.3 1.0 10.7
1875 -4.6 -3.8 1.2 6.2 15.6 20.7 23.3 22.7 17.8 12.0 4.1 1.1 9.7
1876 2.6 -0.1 1.3 8.3 15.7 23.1 26.3 24.0 17.6 10.3 7.3 -3.9 11.1
1877 -2.4 2.8 2.1 8.7 15.3 21.2 23.9 24.1 19.4 13.2 6.9 3.0 11.6
1878 -0.9 0.1 6.7 11.8 15.2 19.8 25.4 23.4 20.2 14.8 6.6 0.4 12.0
1879 -2.8 -2.2 4.4 9.1 17.4 21.2 23.9 22.2 17.4 15.7 6.3 2.9 11.3
1880 4.0 2.9 2.5 10.0 19.9 22.8 23.8 22.6 19.5 12.0 3.7 -3.1 11.7
1881 -4.1 -1.8 2.6 7.9 16.8 18.4 23.2 23.2 23.0 14.9 7.3 4.1 11.3
1882 -1.8 1.8 4.7 8.7 13.7 22.1 24.3 23.0 19.5 13.9 4.0 -0.8 11.1
1883 -3.8 -1.0 0.4 8.4 16.2 23.3 23.6 21.3 17.0 11.2 6.5 0.0 10.3
1884 -4.1 1.1 3.2 8.9 15.4 21.8 22.2 23.2 22.2 14.3 6.8 0.9 11.3
1885 -1.4 -5.2 -0.8 9.7 15.5 21.7 25.8 22.4 18.0 12.3 7.2 2.1 10.6
1886 -2.9 -2.5 3.1 11.6 15.7 20.0 23.8 21.2 18.5 12.7 7.0 -1.3 10.6
1887 -1.6 0.0 0.2 7.9 17.7 20.9 25.7 21.1 16.6 11.2 5.2 1.0 10.5
1888 -5.0 -1.5 -1.1 7.8 14.4 21.6 21.5 22.6 17.1 9.2 7.5 1.5 9.6
1889 2.1 -2.3 4.3 10.7 17.5 21.4 22.9 21.4 18.4 9.8 7.1 4.4 11.5
1890 3.1 3.3 2.0 9.5 15.7 21.2 22.8 22.6 19.5 12.5 6.6 -1.2 11.5
1891 1.0 2.5 2.1 9.8 14.3 21.9 22.4 24.2 22.0 12.6 6.8 5.7 12.1
1892 -0.3 0.8 1.2 9.3 15.1 23.1 23.8 23.5 18.2 11.7 6.3 0.1 11.1
1893 -4.6 -1.4 1.9 8.0 14.6 20.1 23.1 23.1 17.4 13.4 6.1 1.4 10.2
1894 0.9 -1.9 6.0 9.6 16.1 21.3 23.9 21.4 20.4 12.9 5.3 2.7 11.6
1895 -1.2 -4.4 1.9 10.1 16.9 22.7 22.6 24.2 21.6 11.4 8.8 3.4 11.5
1896 -1.2 -0.1 0.3 11.3 19.4 21.0 24.9 24.5 19.6 12.2 9.9 1.2 11.9
1897 -0.7 0.7 4.9 10.3 16.4 19.7 24.4 22.9 19.4 13.7 7.8 3.5 11.9
1898 1.8 2.1 7.6 8.7 14.7 21.8 24.5 24.1 21.3 15.3 7.6 1.4 12.6
1899 -0.3 -2.3 3.3 9.7 16.8 23.4 24.6 24.0 18.9 14.8 7.8 3.4 12.0
1900 -0.1 -0.9 0.8 10.0 15.3 21.4 24.7 24.6 21.4 16.3 9.5 2.4 12.1
1901 0.3 -3.2 3.6 8.8 14.1 21.4 25.4 23.9 20.1 13.3 4.3 2.1 11.2
1902 -0.8 -1.3 6.9 10.3 14.9 19.3 22.7 22.2 19.3 14.6 10.9 0.3 11.6
1903 -0.9 0.7 8.8 11.1 17.1 17.9 23.7 20.6 19.4 14.4 5.7 -0.3 11.5
1904 -3.7 -3.7 2.4 8.1 17.4 21.2 23.7 22.8 19.3 12.1 5.8 -0.9 10.4
1905 -1.5 -4.0 4.7 9.9 16.4 21.1 25.1 23.5 20.9 15.2 6.7 3.8 11.8
1906 3.6 0.4 2.0 10.9 17.3 23.1 25.1 25.1 21.2 14.2 7.5 1.2 12.6
1907 1.6 -3.4 5.8 8.2 13.4 20.3 25.2 23.0 19.4 11.5 7.9 3.8 11.4
1908 0.8 -2.5 5.2 11.2 17.4 22.8 26.6 24.3 20.3 16.0 8.2 3.1 12.8
1909 1.5 3.2 3.2 9.1 16.1 22.3 23.1 22.3 19.3 12.5 9.7 0.2 11.9
1910 -0.5 -1.1 6.1 12.8 16.1 20.4 25.1 22.2 20.8 14.9 5.7 -1.1 11.8
1911 2.4 -0.4 1.5 8.8 17.8 21.0 25.3 22.7 19.8 13.4 5.9 4.1 11.9
1912 -4.6 -1.8 3.1 10.2 16.8 20.9 24.3 22.1 19.2 15.1 8.8 4.1 11.5
1913 4.9 -0.4 7.1 11.4 15.9 21.4 24.5 23.0 18.1 14.8 8.5 3.7 12.8
1914 -0.3 -3.7 2.5 8.8 18.1 20.5 22.3 23.7 19.4 15.2 6.9 -0.2 11.1
1915 1.4 2.2 2.7 12.4 15.0 20.0 23.3 22.0 21.1 14.3 7.9 0.8 11.9
1916 2.2 -2.3 0.2 9.1 16.3 18.7 24.1 23.8 19.7 14.3 7.5 1.1 11.2
1917 0.5 -2.1 4.1 9.1 12.4 21.3 24.4 24.6 17.6 11.7 5.3 -3.9 10.4
1918 -5.7 -0.9 5.6 10.4 18.5 19.9 23.7 24.7 17.7 15.0 8.1 4.1 11.8
1919 2.0 1.6 6.3 10.0 16.7 21.6 23.9 21.7 19.8 15.1 7.3 -1.0 12.1
1920 -4.8 -1.9 4.4 8.9 14.9 20.7 23.2 23.5 20.3 16.2 6.9 2.9 11.3
1921 0.8 1.1 9.1 13.4 16.2 21.8 25.2 22.0 22.3 13.5 7.1 0.3 12.7
1922 -2.1 0.9 5.0 10.8 18.1 22.1 23.2 22.4 20.1 14.6 7.6 0.9 11.9
1923 -1.1 -3.2 2.7 10.2 15.6 23.0 23.2 22.6 20.2 13.3 7.3 5.6 11.6
1924 0.4 -1.7 4.0 9.5 14.1 19.9 23.4 23.5 17.8 13.9 6.9 1.1 11.1
1925 -2.0 3.3 6.8 11.0 15.3 23.5 23.1 22.9 20.4 10.3 6.6 1.6 11.9
1926 0.0 -1.6 2.1 8.5 15.6 19.3 23.9 23.3 18.7 12.8 7.2 -1.7 10.7
1927 -0.6 2.4 6.1 9.2 15.0 19.6 23.3 20.3 19.9 15.3 9.6 2.6 11.9
1928 1.1 0.6 3.8 9.1 15.2 19.7 24.4 24.1 18.2 14.9 8.6 4.1 12.0
1929 -0.1 0.5 7.3 10.6 16.5 21.9 24.4 22.8 20.8 12.6 7.9 2.1 12.3
1930 0.7 2.8 4.6 9.1 17.6 23.1 24.7 23.1 22.2 13.1 7.5 1.4 12.5
1931 0.4 1.1 4.6 10.6 16.4 21.5 25.3 24.0 22.4 16.3 11.1 5.0 13.2
1932 6.2 2.3 2.9 9.4 16.7 21.4 24.5 24.8 20.8 14.7 6.6 3.9 12.9
1933 4.6 1.2 3.6 10.2 18.0 22.4 24.3 23.8 20.9 13.4 5.4 0.4 12.3
1934 1.5 -6.7 2.9 10.2 17.6 23.2 25.4 22.2 20.7 12.5 9.4 0.8 11.7
1935 -1.7 -0.4 6.3 9.9 15.5 21.2 25.1 23.7 18.5 14.2 9.2 -1.1 11.7
1936 -1.5 -3.5 7.3 8.8 18.0 21.0 24.6 24.1 20.1 14.2 5.9 3.7 11.9
1937 4.6 1.6 2.5 9.8 17.9 22.1 24.8 24.8 18.9 13.0 8.0 1.9 12.5
1938 0.1 1.9 6.8 12.1 16.0 21.3 24.8 25.7 18.9 15.4 9.1 2.8 12.9
1939 0.1 2.8 4.0 9.1 18.3 22.8 24.8 25.6 20.3 14.1 6.5 2.7 12.6
1940 -3.9 0.5 1.7 8.2 15.9 21.3 24.6 21.9 19.2 12.1 7.4 3.6 11.1
1941 -1.4 -0.5 2.2 13.8 18.2 22.2 24.3 23.3 21.1 15.9 10.0 3.5 12.7
1942 -0.7 -1.3 6.1 12.1 18.5 21.7 24.6 23.1 20.2 14.9 8.3 -0.5 12.3
1943 -0.7 1.4 4.6 7.8 17.0 24.6 24.9 24.4 19.7 13.2 7.4 0.6 12.1
1944 1.1 0.7 3.1 9.4 19.4 22.4 26.3 25.4 21.2 13.9 7.8 0.2 12.6
1945 -3.8 1.1 10.6 13.1 15.1 21.6 23.7 23.0 21.3 13.4 8.7 -0.6 12.3
1946 1.2 -0.2 9.9 10.2 16.6 20.9 24.1 21.6 21.0 16.5 10.3 3.3 12.9
1947 2.9 -1.5 3.2 10.3 15.5 20.2 24.2 24.4 20.3 17.6 6.8 1.1 12.1
1948 -3.7 -0.7 5.6 10.6 15.7 20.8 25.1 24.0 21.3 13.7 11.3 3.5 12.3
1949 3.7 3.7 6.1 12.1 17.3 23.5 26.4 24.8 19.0 17.3 7.9 4.1 13.8
1950 5.2 -0.2 2.4 9.2 14.9 21.3 23.9 22.8 18.2 15.6 9.1 1.7 12.0
1951 2.5 2.3 5.3 11.7 17.4 21.0 24.9 23.6 20.1 14.8 6.4 3.7 12.8
1952 2.3 2.3 4.6 12.8 15.9 23.1 26.8 23.8 21.1 13.2 9.2 3.6 13.2
1953 3.1 3.6 6.3 11.3 17.4 23.1 25.4 24.3 21.3 15.9 9.8 5.2 13.9
1954 -0.7 4.5 5.3 12.1 15.4 22.0 24.8 22.7 19.7 16.5 8.0 2.2 12.7
1955 -0.6 1.7 5.4 11.9 18.6 20.5 27.2 25.6 19.9 15.4 6.8 -1.3 12.6
1956 0.0 2.6 3.0 9.0 14.8 21.9 22.7 23.4 18.2 14.5 8.2 4.9 11.9
1957 -1.9 2.9 5.5 11.8 17.3 23.5 25.4 23.1 20.9 13.4 9.7 4.6 13.0
1958 -0.1 -2.6 4.6 11.6 15.1 19.6 24.5 24.0 19.8 13.1 8.8 -1.4 11.4
1959 -0.5 0.1 4.5 12.1 19.1 21.8 24.6 25.3 22.4 15.4 7.7 3.6 13.0
1960 1.1 2.4 0.7 12.3 17.0 22.1 23.7 23.8 20.0 14.5 9.8 -0.6 12.2
1961 -2.4 2.6 5.3 9.4 15.5 22.4 25.6 24.7 23.1 16.2 9.3 1.9 12.8
1962 0.3 -0.1 6.2 11.8 18.1 22.5 23.3 22.4 18.3 14.1 6.2 -0.3 11.9
1963 -1.1 -2.1 6.5 12.1 16.2 21.6 24.7 22.3 17.3 16.6 10.2 -0.4 12.0
1964 2.1 0.5 6.2 9.8 18.6 22.0 24.1 22.7 19.6 12.8 9.7 2.4 12.6
1965 -1.3 1.1 4.4 10.3 19.1 21.2 23.5 22.9 19.7 14.1 8.2 4.7 12.3
1966 0.1 1.7 5.9 9.8 16.4 24.1 26.5 24.9 19.2 13.4 9.4 2.1 12.8
1967 3.0 -1.6 3.1 9.8 12.9 22.7 24.1 23.3 19.3 14.0 5.8 3.4 11.7
1968 -2.9 -1.7 6.3 12.8 15.3 20.9 25.2 24.4 21.4 15.8 8.3 1.3 12.3
1969 -0.1 0.3 4.5 13.3 18.5 22.8 23.8 25.2 20.6 14.3 8.0 0.8 12.7
1970 -3.8 0.6 3.7 11.2 17.8 21.6 25.1 25.3 21.6 14.9 9.2 1.3 12.4
1971 -2.8 1.7 4.5 10.4 16.3 23.4 25.4 24.4 22.0 17.1 7.3 4.9 12.9
1972 1.7 -0.3 4.3 10.1 17.4 19.9 25.1 24.2 20.8 11.9 6.9 3.6 12.2
1973 1.9 0.3 8.0 11.9 15.3 23.0 25.2 25.3 20.8 15.7 9.1 3.9 13.4
1974 1.8 -0.2 5.6 12.9 16.1 20.6 25.1 24.7 19.3 12.3 9.0 4.1 12.6
1975 2.9 2.1 4.6 8.8 18.8 21.4 24.3 23.6 17.9 15.1 11.3 2.2 12.7
1976 -2.6 4.4 6.9 12.8 15.7 22.9 23.8 23.5 19.2 11.6 5.4 -1.2 11.9
1977 -5.5 0.8 8.2 12.1 18.3 21.2 26.1 24.3 20.1 12.7 8.5 2.1 12.4
1978 -2.2 -2.7 3.9 10.9 16.4 21.8 23.6 24.4 18.3 12.7 8.8 3.8 11.7
1979 0.9 -3.6 8.3 11.4 18.5 20.7 24.9 24.9 21.4 14.1 11.4 5.1 13.2
1980 0.9 -0.3 5.1 12.5 18.7 21.3 26.3 26.8 21.6 12.9 7.0 0.3 12.8
1981 -3.2 4.1 5.7 13.4 18.2 22.8 25.8 24.4 19.8 12.4 8.7 2.5 12.9
1982 -3.3 1.8 5.6 10.7 17.8 20.3 25.5 22.9 20.2 14.7 10.2 6.0 12.7
1983 1.4 2.4 6.7 11.3 15.7 23.0 26.4 25.4 22.1 14.4 9.4 1.8 13.3
1984 -1.2 4.8 2.6 11.1 16.4 23.6 23.7 24.8 18.8 16.6 8.5 6.6 13.1
1985 -1.8 2.6 7.7 13.1 18.5 20.3 24.6 24.1 21.4 15.3 10.0 1.2 13.1
1986 1.2 0.0 7.3 12.5 18.9 22.0 24.4 22.8 19.9 14.4 7.6 3.9 12.9
1987 0.2 0.7 7.3 11.9 17.6 22.7 25.6 23.4 19.9 12.1 8.7 4.2 12.8
1988 -1.4 1.7 6.4 10.7 17.1 22.1 26.3 26.0 19.7 11.6 9.7 2.2 12.7
1989 3.0 1.4 5.8 11.2 16.7 22.2 23.9 23.3 20.1 14.6 7.6 -3.4 12.2
1990 5.2 4.3 7.3 11.9 15.7 22.3 24.9 24.1 19.7 16.6 10.2 5.9 14.0
1991 1.6 4.4 7.0 13.2 20.4 23.4 25.4 25.1 19.7 14.7 9.1 4.2 14.0
1992 2.1 2.4 4.4 10.3 16.1 21.3 23.4 22.8 19.6 12.5 8.1 3.3 12.2
1993 2.4 -0.7 4.3 11.8 18.7 22.9 26.8 25.1 19.6 13.3 9.3 2.9 13.1
1994 -3.6 -0.8 4.8 13.1 16.6 24.0 26.3 23.3 19.8 14.4 11.1 5.7 12.9
1995 3.1 -0.2 7.2 11.1 16.6 22.1 26.2 25.9 20.2 16.4 6.4 0.2 12.9
1996 -0.8 1.1 3.8 11.2 16.2 21.9 23.0 23.6 20.0 13.6 6.1 5.2 12.1
1997 0.1 4.4 5.5 10.9 15.2 21.6 24.3 22.9 19.4 13.8 6.9 3.5 12.4
1998 4.4 4.8 7.4 12.2 17.9 20.7 24.7 24.8 21.2 14.2 8.9 6.2 14.0
1999 1.1 3.8 5.8 11.9 17.3 22.9 27.4 24.2 20.6 13.3 10.3 4.4 13.6
2000 -0.4 2.9 8.4 10.6 17.5 21.8 22.4 22.6 18.9 13.9 7.4 -0.5 12.2
2001 0.9 2.2 4.2 12.3 17.7 22.7 22.9 25.9 19.8 14.7 11.5 6.7 13.5
2002 4.4 4.8 6.7 13.4 15.9 21.9 26.0 25.4 21.2 12.9 7.8 2.2 13.6
2003 -2.5 -1.1 6.2 9.9 14.8 20.2 24.3 24.8 19.9 12.8 10.0 3.1 11.9
2004 -4.1 1.7 6.4 12.0 18.4 21.8 23.6 23.4 20.7 13.3 9.0 3.6 12.5
2005 -0.4 2.5 4.1 12.8 15.4 23.3 25.3 26.5 22.9 14.4 9.8 1.8 13.2
2006 4.9 2.1 6.2 13.2 17.3 21.7 25.5 24.3 19.2 13.4 11.1 6.4 13.8
2007 3.1 -2.1 5.7 10.2 18.4 21.9 23.9 23.3 21.3 17.6 7.4 2.8 12.8
2008 2.5 2.1 5.9 12.7 15.6 23.3 25.8 23.2 20.4 12.8 7.7 3.4 12.9
2009 -2.3 2.6 5.8 12.5 16.9 19.7 22.6 24.3 19.1 12.8 10.7 2.2 12.2
2010 0.3 0.6 9.0 14.4 18.5 23.7 27.4 25.2 21.7 14.5 8.8 0.4 13.7
2011 -1.3 2.2 5.7 12.4 18.1 22.4 26.8 24.1 21.1 13.9 11.1 6.3 13.6
2012 2.9 4.9 10.5 12.7 18.4 21.7 26.0 24.8 20.4 14.4 6.6 5.3 14.1
2013 1.7 1.1 4.5 11.7 17.1 22.6 26.6 23.7 19.9 15.7 7.4 3.6 12.9
2014 -1.9 -0.2 3.2 11.3 17.8 22.5 24.5 23.6 20.9 15.3 7.4 4.7 12.4
2015 -1.2 -4.5 3.4 12.4 20.3 21.8 26.0 26.1 23.6 14.4 11.6 10.4 13.7
2016 1.4 3.2 9.4 11.8 17.1 22.4 25.9 26.2 22.1 14.9 9.9 3.5 14.0
2017 3.3 5.3 4.0 14.0 16.2 22.2 24.9 23.3 21.4 17.8 8.1 0.8 13.5
2018 -0.2 5.6 4.5 9.7 19.4 22.1 25.3 25.6 21.5 14.3 6.9 4.5 13.3
2019 0.3 2.3 5.4 13.1 16.8 22.1 26.4 24.2 21.3 15.5 6.6 3.5 13.1

Visueel verkennen

Door middel van Stripcharts, Histogrammen, Beeswarms, Lijngrafieken,Boxplots, Violinchart, Kolomdiagram en een Dotchart.

par(mfrow=c(2,3),las=1,pch=19, cex=0.9,bg="#FFFFFF")
                  #mfrow= 3 plots in 2 rijen en de method = "jitter"
                                  stripchart(klimaatNY$Jaargemiddelde ,main = "a. Jaargemiddelde\nTemperatuur",col.main="#666666",method="stack",col="#212121",pch=1, vertical = TRUE, ylab = "°Celsius",frame=FALSE)
                  stripchart(klimaatNY$Jan,main = "b. Januari\nTemperatuur",col.main="#666666", method="jitter",col="#1565C0",pch=1, vertical = TRUE, ylab = "°Celsius",frame=FALSE)
                  stripchart(klimaatNY$Feb,main = "c. Februari\nTemperatuur",col.main="#666666", method="stack",col="#ff8c00",pch=1, vertical = TRUE, ylab = "°Celsius",frame=FALSE)
                  stripchart(klimaatNY$Aug ,main = "d. Augustus\nTemperatuur",col.main="#666666",method="jitter",col="#212121",pch=1, vertical = TRUE, ylab = "°Celsius",frame=FALSE)
                  stripchart(klimaatNY$Okt,main = "e. Oktober\nTemperatuur",col.main="#666666", method="stack",col="#1565C0",jitter=0.5,pch=1, vertical = TRUE, ylab = "°Celsius",frame=FALSE)
                  stripchart(klimaatNY$Dec,main = "f. December\nTemperatuur",col.main="#666666", method="jitter",col="#ff8c00",pch=1, vertical = TRUE, ylab = "°Celsius",frame=FALSE)
Figuur 175 a t/m f. Stacked Stripcharts.

Figuur 175 a t/m f. Stacked Stripcharts.

# Stack stripchart Variant 
par(mar=c(5,4,2,1),mfrow=c(1,2)) 
# mar = marge in regels: bottom, left, top, and right
                  x <- list("Januari" = klimaatNY$Jan,"Jaargemiddelde" = klimaatNY$Jaargemiddelde, 
                  "Aug" = klimaatNY$Aug)
                  
                  #maak plot met een strip per variabele                  
                  par(bty="l", bg="#FFFFFF")
                  stripchart(x,main = "a. Gemiddelde Temperatuur",sub="Central Park New York, 1869 - 2019 (n=151)",col.main="#444347",
                  xlab = "Temperatuur °C",col.lab="#444347", adj=0,
                  ylab = "Maanden",col.lab="#444347",
                  col = c("#1565C0", "#ff8c00","#cccccc"),
                  pch = 16,at=c(1.00,1.75,2.50),#plaatsen van de strips op de y-as
                  method = "jitter",frame=FALSE)
                  
                  
                  par( bty="l",bg="#FFFFFF")
                  stripchart(x,main = "b. Gemiddelde Temperatuur",sub="Central Park New York, 1869 - 2019 (n=151)",col.main="#444347",
                             xlab = "Temperatuur °C",col.lab="#444347", adj=0,
                              ylab = "Maanden & Jaargemiddelde",col.lab="#444347",ylim=c(1,3),
                             col = c("#1565C0", "#ff8c00","#cccccc"),
                             pch = 16,at=c(1.00,1.75,2.50),#plaatsen van de strips op de y-as
                             method = "stack",frame=FALSE)
Figuur 176 a en b. Varianten Stripcharts met verschillende methoden ('jitter' en 'stack')

Figuur 176 a en b. Varianten Stripcharts met verschillende methoden (‘jitter’ en ‘stack’)

par(bty="n",bg="#FFFFFF")
                  stripchart(klimaatNY$Jaargemiddelde,axes=FALSE,xlab="Temperatuur in°Celcius",col.lab="#444347", method = "stack", col="#ff8C00")
                  titel = "Jaargemiddelde Central Park, New York"
                  subtitel="Waarnemingen van de gemiddelde jaartemperaturen tussen 1869 - 2019 (151 jaar)"
                  #mtext(side=3,line=3,adj=0,cex=0,7,subtitel)
                  #mtext(side=3,line=2,,adj=0,cex=1,titel)
                  mtext(titel, side=3, line=1, adj=0, font=2, cex=1.5,col="#444347")
                  mtext(subtitel, side=3, line=0, adj=0,cex=1,col="#444347")
                  axis(1, col="#444347", col.ticks="#444347", col.axis="#444347", cex.axis=0.8)
Figuur 177. Nog een Stripchart. Methode 'stack' is gebruikt.

Figuur 177. Nog een Stripchart. Methode ‘stack’ is gebruikt.

par(mfrow=c(2,1),las=1,pch=19, cex=0.8, bty="n",bg="#FFFFFF")
                  x <- list("Jan." = klimaatNY$Jan, "Feb." = klimaatNY$Feb,
                  "Maart" = klimaatNY$Mar, "April" = klimaatNY$Apr,
                  "Mei" = klimaatNY$Mei, "Juni" = klimaatNY$Jun)
                 
                  
#maak plot met een strip per variabele
                  
stripchart(x,main = "a. Maandtemperatuur Central Park New York,\n1869 - 2019 (n=151)",col.lab="#444347",  xlab = "Temperatuur  °C", 
                             ylab = "Maanden",
                             col = c("steelblue", "coral2"),
                             pch = 16,
                             method = "jitter")
                  
#maak plot met een strip per variabele
stripchart(x, main = "b. Maandtemperatuur Central Park New York,\n1869 - 2019 (n=151)",col.lab="#444347",  xlab = "Temperatuur  °C", 
                             ylab = "Maanden",
                             col = c("steelblue", "coral2"),
                             pch = 16,
                             method = "stack",vertical=TRUE)        
Figuur 178. Twee stripcharts met meerdere maanden en met verschillende methoden ('jitter' en 'stack')

Figuur 178. Twee stripcharts met meerdere maanden en met verschillende methoden (‘jitter’ en ‘stack’)


Histogrammen

par(mfrow=c(2,2),las=1,cex=0.8,bg = "#889AA3",mar = c(4, 4,4, 4))
                  hist(klimaatNY$Jaargemiddelde,main="a. Jaargemiddelde", las=1,breaks=6,col="steelblue1")
                  hist(klimaatNY$Jan,main="b. Januaritemperatuur", las=1,breaks=6,col="#1565C0")
                  hist(klimaatNY$Mei,main="c. Meitemperatuur", las=1,breaks=6,col="ghostwhite")
                  hist(klimaatNY$Aug,main="d. Augustustemperatuur", las=1,breaks=6,col="darkorange")
Figuur 179. Histogrammen gaan over spreiding van gegevens.

Figuur 179. Histogrammen gaan over spreiding van gegevens.

par(mfrow=c(2,2),las=1,cex=0.8,bg = "#889AA3",mar = c(4, 4,4, 4))
                  hist(klimaatNY$Jaargemiddelde,main="Standaard bins", las=1,breaks=6,col="steelblue1")
                  hist(klimaatNY$Jan,main="Met 10 bins",las=1,breaks=10,col="#1565C0")
                  hist(klimaatNY$Mei,main="Met 15 bins", las=1,breaks=15,col="ghostwhite")
                  hist(klimaatNY$Aug,main="Met 20 bins", las=1,breaks=20,col="darkorange")
Figuur 180. Histogrammen met variabele bins.

Figuur 180. Histogrammen met variabele bins.

par(las=1)
hist(klimaatNY$Jaargemiddelde, las=1,breaks=6,col="steelblue1",
     prob = TRUE, # show densities inplaats van frequencies
     xlab = "Gemiddelde Jaartemperatuur",
     main = "Histogram en densityplot gecombineerd weergegeven.")
lines(density(klimaatNY$Jaargemiddelde), # density plot
      lwd = 2, # lijndikte
      col = "#c70131")
Figuur 181. Histogram met densitylijn gecombineerd.

Figuur 181. Histogram met densitylijn gecombineerd.


Beeswarm (met en zonder boxplot)

#install.packages("beeswarm")
library("beeswarm")
par(mfrow=c(1,2),las=1,bty="n")
beeswarm(klimaatNY$Jaargemiddelde,main="a. Gemiddelde Jaar-\ntemperatuur tussen 1869 - 2019.")
                  
beeswarm(klimaatNY$Jan, pch = 16, col = 3,
                           main = 'b. Gemiddelde Januari-\ntemperatuur tussen 1869 - 2019.')
Figuur 182 a en b. Beeswarms.

Figuur 182 a en b. Beeswarms.

par(las=1,pch=19, cex=0.9,bty="n")
    boxplot(klimaatNY$Jan, outline = FALSE, # vermijdt double-plotting outliers ,
            main = 'Boxplot + Beeswarm')
                  
    beeswarm(klimaatNY$Jan,col = 4, pch = 16, add = TRUE)
Figuur 183. Combinatie beeswarm & boxplot.

Figuur 183. Combinatie beeswarm & boxplot.


Lijngrafiek

par(las=1,cex=0.8,bty="n",bg="#FFFFFF")

x = 1869:2019
plot(klimaatNY$Feb~klimaatNY$Jaar, data=klimaatNY, type="l", col="#1565C0", ylim=c(-10,30),
     axes=FALSE,las=1,xlab="Jaren",lwd=2, ylab="Temperatuur  °C")
lines(klimaatNY$Aug~klimaatNY$Jaar, data=klimaatNY, type="l",lty=1, col="#ff8C00",lwd=2)
lines(klimaatNY$Jaargemiddelde~klimaatNY$Jaar, data=klimaatNY, type="l",lty=1, col="#CCCCCC",lwd=2)

axis(1,x,pos=-10,col="#444347", col.ticks="#444347", col.axis="#444347", cex.axis=0.8,tck=-.01)
axis(2,col="#444347", col.ticks="#444347", col.axis="#444347", cex.axis=0.8, las=1)
title(main="Temperatuur in Central Park New York (1869 - 2019, n=151)",adj=0, col.main="#444347", font.main=2)
abline(h=0.00264907,col="#444347",lty=3)
abline(h=-10, col="#444347",lty=3)
abline(v=1869,col="#CCCCCC",lty=3)
abline(v=2019,col="#CCCCCC",lty=3)
abline(h=23.66755,col="#444347",lty=3)
abline(h=12.20728,col="#CCCCCC",lty=3)
text(2018, 28, "Augustus temperatuur(gemiddeld)",cex = .9,col="#ff8C00",font=2,adj=c(1,0))
text(2018, 7, "Februari temperatuur(gemiddeld)",cex = .9,col="#2565C0",font=2,adj=c(1,0))
text(2018, 16, "Jaar temperatuur(gemiddeld)",cex = .9,col="#CCCCCC",font=2,adj=c(1,0))
Figuur 184. Lijngrafiek met direct labeling.

Figuur 184. Lijngrafiek met direct labeling.


Boxplot

par(mfrow=c(2,2),font.lab=3,cex.lab=0.8,font.main=2,cex.main=1,adj=0,bg="#F8F8FF",bty="n")
                
                boxplot(klimaatNY$Jan, main= "a. Boxplot:\nMediaan Januaritemperatuur",col.main="#444347", 
                        ylab="Temperatuur °C", las=1, col="#1565C0", ylim=c(-10,10),medcol="#212121",boxlty=0,staplelwd = 1.5,outpch = 16 )
                abline(h=0, col="#1565C0",lty=3)
                
                boxplot(klimaatNY$Aug, main= "b. Boxplot:\nMediaan Augustustemperatuur",col.main="#444347",
                        ylab="Temperatuur °C", las=1, col = "#ff8c00", ylim=c(20,28),medcol="#212121",boxlty=0,staplelwd = 1,outpch = 16 )
                abline(h=23.6,col="#ff8c00",lty=3)
                
                boxplot(klimaatNY$Jan, main= "c. Boxplot:\nMediaan Januaritemperatuur", col.main="#444347",
                        xlab="Temperatuur °C", las=1, col="#1565C0", ylim=c(-10,10),medcol="#212121",boxlty=0,staplelwd = 1,outpch = 16,
                        horizontal =TRUE)
                abline(v=0, col="#1565C0",lty=3)
                
                boxplot(klimaatNY$Aug, main= "d. Boxplot:\nMediaan Augustustemperatuur",col.main="#444347",
                       xlab="Temperatuur  °C", las=1, col = "#ff8c00", ylim=c(20,28),medcol="#212121",boxlty=0,staplelwd = 1,outpch = 16,
                        horizontal =TRUE)
                abline(v=23.6,col="#ff8c00",lty=3)
Figuur 185. Boxplots.

Figuur 185. Boxplots.

                # meer statistische info boxplot: o.a. over uitbijters
                summary(klimaatNY$Jan)
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -5.700000 -1.750000  0.000000 -0.002649  1.700000  6.200000

Violinplot

# hoe meer waarden in een bepaalde "range" hoe breder de violin wordt
# lijkt erg op een boxplot (zie midden in de violin) 

#install.package("vioplot)                
library(vioplot)
## Loading required package: sm
## Package 'sm', version 2.2-5.6: type help(sm) for summary information
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
              par(bty="l",cex=0.8, bg="#F8F8FF")
              x1 <- klimaatNY$Jan
              x2 <- klimaatNY$Aug
              x3 <- klimaatNY$Dec
vioplot(x1, x2, x3, names=c("Januaritemperatuur", "Augustustemperatuur", "Decembertemperatuur"),col="#ff8c00", ylab="Temperatuur  °C", las=1)
              title("Mediaan van de Maandtemperatuur in Central Park New York, 1869 - 2019", col.main="#1C1C1C",adj=0)
              abline(h=-0.002649007, col="#ff8c00",lty=3)
              abline(h=23.6, col="#ff8c00",lty=3)
              abline(h=2.2, col="#ff8c00",lty=3)
Figuur 186. Violinplot. In de 'vlinder' zit een boxplot, met mediaanstip.

Figuur 186. Violinplot. In de ‘vlinder’ zit een boxplot, met mediaanstip.


Dotchart

      data2 = klimaatNY[order(klimaatNY$Jaar),]
      dotchart(data2$Jaargemiddelde,ylab="", cex = .9, 
               main = "Alle Jaargemiddelden van 1869 - 2019 (151 jaar)\n Central Park New York.",
               xlab = "Gemiddelde Jaartemperaturen in °C",
               pch = 19, col = c("#212121","#ff8c00"),
               cex.main = 1, cex.lab = 0.5)
Figuur 187. Dotchart 1869 - 2019. Gemiddelde Jaartemperaturen.

Figuur 187. Dotchart 1869 - 2019. Gemiddelde Jaartemperaturen.

      barplot(klimaatNY$Jan~klimaatNY$Jaar,data=klimaatNY, main= "Kolomdiagram Januaritemperatuur",col.main="#444347",
              xlab="Jaar", las=1, col = "#ff8c00", ylim=c(-10,10),ylab="Temperatuur °C",border=NA)
Figuur 188. Kolomdiagram.

Figuur 188. Kolomdiagram.


Declutter (Vraagt om Selectie!)

Uitwerking van de lijngrafiek uit afbeelding 184.

par(cex=0.8,bty="n",bg="#FFFFFF",mar=c(5,5,5,0),las=1)

x = 1869:2019 # x heeft een waarde van het jaar 1869 tot en met 2019

plot(klimaatNY$Jan~klimaatNY$Jaar,data=klimaatNY,type="l", col="#1565C0", ylim=c(-10,30),
     axes=FALSE,xlab="Jaren",lwd=2,ylab="Temperatuur  °C")
lines(klimaatNY$Feb~klimaatNY$Jaar,type="l",lty=1,col="#ffa42e",lwd=2)
lines(klimaatNY$Mar~klimaatNY$Jaar,type="l",lty=1,col="#ff6d3e",lwd=2)
lines(klimaatNY$Apr~klimaatNY$Jaar,type="l",lty=1,col="#ff5264",lwd=2)
lines(klimaatNY$Mei~klimaatNY$Jaar,type="l",lty=1,col="#f94588",lwd=2)
lines(klimaatNY$Jun~klimaatNY$Jaar,type="l",lty=1,col="#d94aa6",lwd=2)
lines(klimaatNY$Jul~klimaatNY$Jaar,type="l",lty=1,col="#ad56bb",lwd=2)
lines(klimaatNY$Aug~klimaatNY$Jaar,type="l",lty=1,col="#7360c4",lwd=2)
lines(klimaatNY$Sep~klimaatNY$Jaar,type="l",lty=1,col="#1565c0",lwd=2)
lines(klimaatNY$Okt~klimaatNY$Jaar,type="l",lty=1,col="#1460b7",lwd=2)
lines(klimaatNY$Nov~klimaatNY$Jaar,type="l",lty=1,col="#135bae",lwd=2)
lines(klimaatNY$Dec~klimaatNY$Jaar,type="l",lty=1,col="#1157a5",lwd=2)
lines(klimaatNY$Jaargemiddelde~klimaatNY$Jaar,type="l",lty=1,col="#10529c",lwd=2)


axis(1,x,pos=-10, col="#444347", col.ticks="#444347", col.axis="#444347", cex.axis=0.8,tck=-.01)
axis(2, col="#444347", col.ticks="#444347", col.axis="#444347", cex.axis=0.8)
# Maak de titel,kleur grijs bold/italic font7360c4
title(main="Temperatuur in Central Park New York (1869 - 2019, n=151)", col.main="#444347", font.main=2)
abline(h=0, col="#444347")
legend(1990,30, legend=c ("Januari","Februari","Maart","April","Mei","Juni","Juli","Augustus","September","Oktober","November","December","Jaargemiddelde"),
       col=c("#ffa42e", "#ff8C00","#ff6d3e","#ff5264","#f94588","#d94aa6","#ad56bb","#7360c4","#1565c0","#1460b7","#135bae","#1157a5","#10529c"),pch =19, cex=.9,
       box.col = "#FFFFFF",bg = "#ffffff95")#transparant wit door de twee cijfers na de letters
Afbeelding 189. Alle informatie uit de dataset wordt gebruikt voor een visualisatie. Dat levert een 'spaghetti-afbeelding' op, volstrekt onleesbaar voor een gebruiker. Hier moet selectie op worden toegepast. Weglaten van gegevens moet verantwoord gebeuren! Keuze om te generaliseren!

Afbeelding 189. Alle informatie uit de dataset wordt gebruikt voor een visualisatie. Dat levert een ‘spaghetti-afbeelding’ op, volstrekt onleesbaar voor een gebruiker. Hier moet selectie op worden toegepast. Weglaten van gegevens moet verantwoord gebeuren! Keuze om te generaliseren!

par(cex=0.8,bty="n",bg="#FFFFFF",mar=c(5,5,5,0),las=1)

x = 1869:2019 # x heeft een waarde van het jaar 1869 tot en met 2019

plot(klimaatNY$Jan~klimaatNY$Jaar,data=klimaatNY,type="l", col="#1565C0", 
ylim=c(-10,30),axes=FALSE,xlab="Jaren",lwd=2,ylab="Temperatuur °C")
lines(klimaatNY$Jaargemiddelde~klimaatNY$Jaar,type="l",lty=1,col="#ab3a2c",lwd=2)
lines(klimaatNY$Aug~klimaatNY$Jaar,type="l",lty=1,col="#ffa500",lwd=2)
lines(klimaatNY$Feb~klimaatNY$Jaar,type="l",lty=1,col="grey90",lwd=1)
lines(klimaatNY$Mar~klimaatNY$Jaar,type="l",lty=1,col="grey90",lwd=1)
lines(klimaatNY$Apr~klimaatNY$Jaar,type="l",lty=1,col="grey90",lwd=1)
lines(klimaatNY$Mei~klimaatNY$Jaar,type="l",lty=1,col="grey90",lwd=1)
lines(klimaatNY$Jun~klimaatNY$Jaar,type="l",lty=1,col="grey90",lwd=1)
lines(klimaatNY$Jul~klimaatNY$Jaar,type="l",lty=1,col="grey90",lwd=1)
lines(klimaatNY$Sep~klimaatNY$Jaar,type="l",lty=1,col="grey90",lwd=1)
lines(klimaatNY$Okt~klimaatNY$Jaar,type="l",lty=1,col="grey90",lwd=1)
lines(klimaatNY$Nov~klimaatNY$Jaar,type="l",lty=1,col="grey90",lwd=1)
lines(klimaatNY$Dec~klimaatNY$Jaar,type="l",lty=1,col="grey90",lwd=1)


axis(1,x,pos=-10, col="#444347", col.ticks="#444347", col.axis="#444347", cex.axis=0.8,tck=-.01)
axis(2, col="#444347", col.ticks="#444347", col.axis="#444347", cex.axis=0.8)
# Maak de titel,kleur grijs bold/italic font7360c4
title(main="Temperatuur in Central Park New York (1869 - 2019, n=151)", col.main="#444347", font.main=2)
abline(h=0, col="#444347")
legend("topright", legend=c ("Augustus","Jaargemiddelde","Januari"),
       col=c("#ffa500","#ab3a2c","#1565c0"),pch =19, cex=.9,bty="n",
       bg = "#ffffff95")#transparant wit door de twee cijfers na de letters
Figuur 190. Mogelijkheid 1: Maak grijs wat minder belangrijk is. Zet de legenda-onderdelen in de juiste volgorde, gelijk aan de volgorde van de lijnen.

Figuur 190. Mogelijkheid 1: Maak grijs wat minder belangrijk is. Zet de legenda-onderdelen in de juiste volgorde, gelijk aan de volgorde van de lijnen.

windowsFonts(
  A=windowsFont("Verdana"),
  B=windowsFont("Bookman Old Style"),
  C=windowsFont("Bahnschrift Light"),
  D=windowsFont("Symbol"))
  
  
auteur <- c("© 2021 Hans den Hartog")
par(las=1,cex=0.8,bty="n",bg="#FFFFFF",adj=0,family="C", mar=c(5,5,5,8))

x = 1869:2019 # x heeft een waarde van het jaar 1869 tot en met 2019

plot(klimaatNY$Jan~klimaatNY$Jaar,data=klimaatNY,type="l", 
     col="#1565C0", ylim=c(-10,30),axes=FALSE,xlab="Jaren",lwd=2,ylab="",cex=0.7)
lines(klimaatNY$Aug~klimaatNY$Jaar,type="l",lty=1,col="#ffa500",lwd=2)
lines(klimaatNY$Jaargemiddelde~klimaatNY$Jaar,type="l",lty=1,col="#AB3A2C",lwd=2)
mtext("Temperatuur°C",side=3,line=-0.5,at=1869,cex=0.7,font=2,col="#444347")

axis(1,x,pos=-10, col="#444347", col.ticks="#444347", col.axis="#444347", cex.axis=0.8,tck=-.01)
axis(2, col="#444347", col.ticks="#444347", col.axis="#444347", cex.axis=0.8)
# Maak de titel,kleur grijs bold/italic font7360c4
title(main="Temperatuur in Central Park New York (1869 - 2019, n = 151)", col.main="#444347", font.main=2,cex.main = 1)
abline(h=0, col="#444347",lty=3)
abline(h=12.2, col="#AB3A2C",lty=3)
abline(h=23.66, col="#ffa500",lty=3)

mtext(side=4,at=klimaatNY$Aug[length(klimaatNY$Aug)],text ="Augustus",col="#ffa500",line=0.3,las=2)
mtext(side=4,at=klimaatNY$Jan[length(klimaatNY$Jan)],text ="Januari",col="#1565C0",line=0.3,las=2)
mtext(side=4,at=klimaatNY$Jaargemiddelde[length(klimaatNY$Jaargemiddelde)],text ="Jaargemiddelde",col="#AB3A2C",line=0.3,las=2)

mtext(auteur, side=1,line=3, cex=0.7, col="#444347", adj=1)
Figuur 191. Uitlichten van enkele belangrijke gegevens geeft de gebruiker meer inzicht in de informatie van deze grafiek. De drie toegevoegde lijnen geven de gemiddelde temperatuur weer voor januari, augustus en het jaargemiddelde.

Figuur 191. Uitlichten van enkele belangrijke gegevens geeft de gebruiker meer inzicht in de informatie van deze grafiek. De drie toegevoegde lijnen geven de gemiddelde temperatuur weer voor januari, augustus en het jaargemiddelde.

windowsFonts(
  A=windowsFont("Verdana"),
  B=windowsFont("Bookman Old Style"),
  C=windowsFont("Bahnschrift Light"),
  D=windowsFont("Symbol"))
  
  
auteur <- c("© 2021 Hans den Hartog")
par(las=1,bty="n",adj=0,family="C")

plot(klimaatNY$Jaar~klimaatNY$Jaargemiddelde,xlab="Jaargemiddelde Temperatuur in °Celsius tussen 1861 - 2019.",ylab="",main="Wordt het gemiddeld warmer in Central Park?",frame=FALSE,xlim=c(10,15),ylim=c(1850,2050),pch=21,bg="#AB3A2C",
      cex=0.8)

reg<-lm(klimaatNY$Jaar~klimaatNY$Jaargemiddelde)
abline (reg, col="red",lwd=2,lty=2)
abline(h=2019, col="#ffa500",lty=3)

mtext("Jaartallen",side=3,line=-0.5,at=10,cex=1,font=1,col="black")
mtext("2019",side=3,line=-2.5,at=10,cex=0.7,font=2,col="#ffa500")
mtext(auteur, side=1,line=3, cex=0.7, col="#444347", adj=1)
Figuur 192. Spreidingsdiagram Jaar & Jaargemiddelde Temperatuur.

Figuur 192. Spreidingsdiagram Jaar & Jaargemiddelde Temperatuur.

De grafieken van afbeelding 191 en 192 wil ik gebruiken voor een presentatie (“storytelling with data”) aan een publiek van geïnteresseerde “klimaatactivisten”.

…… ter info link naar het Central Park Beheer ……

Central Park Conservancy


Figuur 193. Central Park New York, standbeeld Columbus, oktober 2012, ©2021 Hans den Hartog.

Figuur 194. Kaartje Central Park New York, met locatie standbeeld Columbus in Central Park.