## Rows: 121
## Columns: 21
## $ site                           <chr> "StackOverflow", "StackOverflow", "Sta…
## $ country                        <chr> "Argentina", "Australia", "Austria", "…
## $ PDI                            <dbl> 49, 36, 11, 80, 65, 69, 70, 39, 63, 80…
## $ IDV                            <dbl> 46, 90, 55, 20, 75, 38, 30, 80, 23, 20…
## $ MAS                            <dbl> 56, 61, 79, 55, 54, 49, 40, 52, 28, 66…
## $ UAI                            <dbl> 86, 51, 70, 60, 94, 76, 85, 48, 86, 30…
## $ usuarios                       <dbl> 2798, 12313, 2518, 2558, 4275, 10717, …
## $ responderam_prop               <dbl> 0.5357398, 0.6133355, 0.6310564, 0.392…
## $ perguntaram_prop               <dbl> 0.5210865, 0.5897832, 0.5933280, 0.475…
## $ editaram_prop                  <dbl> 0.09256612, 0.14699911, 0.14932486, 0.…
## $ comentaram_prop                <dbl> 0.25339528, 0.33395598, 0.35027800, 0.…
## $ GNI                            <dbl> NA, 59570, 48160, 840, 44990, 11630, 6…
## $ Internet                       <dbl> 51.0, 79.5, 79.8, 5.0, 78.0, 45.0, 51.…
## $ EPI                            <dbl> 59.02, NA, 63.21, NA, 61.21, 49.96, NA…
## $ geo                            <chr> "arg", "aus", "aut", "bgd", "bel", "br…
## $ four_regions                   <chr> "americas", "asia", "europe", "asia", …
## $ eight_regions                  <chr> "america_south", "east_asia_pacific", …
## $ six_regions                    <chr> "america", "east_asia_pacific", "europ…
## $ Latitude                       <dbl> -34.00000, -25.00000, 47.33333, 24.000…
## $ Longitude                      <dbl> -64.00000, 135.00000, 13.33333, 90.000…
## $ `World bank income group 2017` <chr> "Upper middle income", "High income", …

Estamos interessados na relação entre quanto as pessoas de diferentes países comentam em questões dos outros. A proporção das pessoas do país que comentou nas questões de outros está medido na variável comentaram_prop.

Considerando essa variável, queremos examinar a relação entre ela e o quão hierárquicas são as relações em um país (PDI). Queremos também levar em conta o quanto as pessoas daquele país têm acesso à Internet (Internet) e qual o tamanho da base de dados que detectamos daquele país (usuarios).

Examinando essa relação

Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto.

## Warning: Removed 3 rows containing missing values (geom_point).

  • Pontos que podem ser observados:
    • Geralmente, quanto mais acesso a internet, menor o PDI;
    • O pontos aparentemente formam um padrao, que talvez seja a relação linear entre o quanto as pessoas têm acesso à Internet e a proporção de pessoas que comentou nas questões de outros. (Internetx comentaram_prop)
    • Os pontos menores também tendem a ser mais claros (- usuários, + PDI)

Outras formas de ver

Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam menos eficazes que a que você escolheu acima.

  1. Cores e tamanhos dos pontos muito similares.
## Warning: Removed 3 rows containing missing values (geom_point).

  1. Cores e tamanhos dos pontos muito similares.

  1. Cores e tamanhos dos pontos muito similares
## Warning: Removed 3 rows containing missing values (geom_point).

As três visualização ficaram muito similares em relação a dificuldade de entendimento, além das cores e tamanhos, os pontos não formam nenhum padrão, curva, ou reta, o que pode dificultar na hora de relacionar as variáveis dos eixos x e y.

  1. Sem variação de cores nos pontos.
## Warning: Removed 3 rows containing missing values (geom_point).

  1. Sem muita variação de cores nos pontos.

Nas visualizações 4 e 5 as cores ficaram muito próximas também. A partir dessas duas últimas vemos que a variável Internet talvez seja a pior escolha para representação em forma de cor ou tamanho, talvez porque o seus valores não sofrem tantas variações ou variações bruscas.

Bônus

Inclua o continente dos países (six_regions) na visualização.

## Warning: Removed 6 rows containing missing values (geom_point).