summary(dataXY)
## CALORIES ESPVIDA
## Min. :1505 Min. :39.00
## 1st Qu.:2248 1st Qu.:55.77
## Median :2614 Median :67.55
## Mean :2661 Mean :64.57
## 3rd Qu.:3166 3rd Qu.:72.88
## Max. :3947 Max. :79.50
Les dues variables que tenim són la de Calories i la d’Esperança la Vida, i en la taula anterior es veuen els seus elements principals. Algunes coses a destacar respecte a la de calories, per exemple, pot ser que la seva mitjana (mean: 2661) és major a la seva mediana (median: 2614). Això significa que la seva distribució estarà esbiaixada cap a la dreta. En el cas de la variable d’esperança de vida passa el contrari (mitjana < mediana).La mitjana d’esperança de vida és de 64.57 anys. El rang de calories (max-min) és de 2442, mentre que el de esperança de vida és de 40.5.
library(ggplot2)
ggplot(dataXY, aes(x=CALORIES, y=ESPVIDA)) +
geom_point()
A falta de comprovacions més profundes s’observa un certa associació positiva entre ambdues variables. Això significa que, com major és el consum de calories en un país, major és la seva l’esperança de vida. De totes maneres, això no lleva que hi hagi alguns casos atípics.
Tot i que s’observi associació, això no significa que hi hagi d’haver causalitat. Correlació no implica causalitat.